Combating Partial Perception Deficit in Autonomous Driving with Multimodal LLM Commonsense
作者: Yuting Hu, Chenhui Xu, Ruiyang Qin, Dancheng Liu, Amir Nassereldine, Yiyu Shi, Jinjun Xiong
发布时间: 2025-03-11
来源: arxiv
研究方向: 自动驾驶
主要内容
该研究提出了一种名为LLM-RCO的框架,用于应对自动驾驶中感知缺陷的问题。该框架利用大型语言模型(LLM)的常识推理能力,通过四个关键模块(危险推理、短期运动规划、动作条件验证和安全性约束生成)与动态驾驶环境交互,从而实现主动和情境感知的控制动作,以克服感知缺陷带来的挑战。
主要贡献
1. 提出了一种名为LLM-RCO的框架,将人类驾驶员在面对感知缺陷时的思维过程分解为四个LLM增强的模块。
2. 构建了DriveLM-Deficit数据集,用于对LLM进行危险推理和运动规划微调。
3. 在DriveLM-Deficit数据集上对Qwen2-VL-2B-Instruct进行微调,以增强LLM-RCO的危险推理和运动规划。
4. 在CARLA模拟器中验证了LLM-RCO的有效性,证明了其在感知缺陷条件下的驾驶性能提升。
研究方法
1. 利用LLM进行危险推理和运动规划。
2. 构建DriveLM-Deficit数据集,用于微调LLM。
3. 使用LoRA进行模型微调。
4. 在CARLA模拟器中进行实验验证。
实验结果
实验结果表明,与传统的自动驾驶系统相比,LLM-RCO在感知缺陷条件下显著提高了驾驶性能,降低了事故发生率,并提高了行驶效率。
未来工作
未来可以进一步研究如何将LLM-RCO应用于更复杂的驾驶场景,并探索将LLM与其他技术(如深度学习)结合使用,以进一步提高自动驾驶系统的鲁棒性和安全性。