Discrete Contrastive Learning for Diffusion Policies in Autonomous Driving
作者: Kalle Kujanpää, Daulet Baimukashev, Farzeen Munir, Shoaib Azam, Tomasz Piotr Kucner, Joni Pajarinen, Ville Kyrki
发布时间: 2025-03-10
来源: arxiv
研究方向: 自动驾驶与行为建模
主要内容
本文提出了一种名为DSDP(离散风格扩散策略)的框架,用于从现有数据集中学习人类驾驶行为。该框架利用对比学习提取驾驶风格字典,并通过量化离散化这些风格,用于学习条件扩散策略以模拟人类驾驶员的行为。
主要贡献
1. 提出了一种无监督的离散驾驶风格提取方法,使用对比InfoNCE损失和LFQ从无标签数据中建模人类驾驶行为。
2. 开发了DSDP方法,该方法结合了驾驶风格提取和条件DDPM进行动作生成。
3. 在历史驾驶数据上进行了全面评估,包括一系列消融研究。
研究方法
1. 对比学习
2. Lookup-Free Quantization (LFQ)
3. 条件Denoising Diffusion Probabilistic Model (DDPM)
4. 行为克隆(BC)
实验结果
在NGSIM和highway-env环境中的实验表明,DSDP在安全性和人类相似度方面均优于基线方法。与基线方法相比,DSDP实现了更低的碰撞百分比和更高的F1分数。
未来工作
未来工作可以探索模拟人类驾驶员的有限观察能力、扩展方法以学习高维视觉数据、将模型应用于其他复杂交互环境,以及探索DSDP原理在其他领域的应用。