Combating Partial Perception Deficit in Autonomous Driving with Multimodal LLM Commonsense

作者: Yuting Hu, Chenhui Xu, Ruiyang Qin, Dancheng Liu, Amir Nassereldine, Yiyu Shi, Jinjun Xiong

发布时间: 2025-03-11

来源: arxiv

研究方向: 自动驾驶

主要内容

该研究提出了一种名为LLM-RCO的框架，用于应对自动驾驶中感知缺陷的问题。该框架利用大型语言模型（LLM）的常识推理能力，通过四个关键模块（危险推理、短期运动规划、动作条件验证和安全性约束生成）与动态驾驶环境交互，从而实现主动和情境感知的控制动作，以克服感知缺陷带来的挑战。

1. 提出了一种名为LLM-RCO的框架，将人类驾驶员在面对感知缺陷时的思维过程分解为四个LLM增强的模块。

2. 构建了DriveLM-Deficit数据集，用于对LLM进行危险推理和运动规划微调。

3. 在DriveLM-Deficit数据集上对Qwen2-VL-2B-Instruct进行微调，以增强LLM-RCO的危险推理和运动规划。

4. 在CARLA模拟器中验证了LLM-RCO的有效性，证明了其在感知缺陷条件下的驾驶性能提升。

1. 利用LLM进行危险推理和运动规划。

2. 构建DriveLM-Deficit数据集，用于微调LLM。

3. 使用LoRA进行模型微调。

4. 在CARLA模拟器中进行实验验证。

实验结果表明，与传统的自动驾驶系统相比，LLM-RCO在感知缺陷条件下显著提高了驾驶性能，降低了事故发生率，并提高了行驶效率。

未来可以进一步研究如何将LLM-RCO应用于更复杂的驾驶场景，并探索将LLM与其他技术（如深度学习）结合使用，以进一步提高自动驾驶系统的鲁棒性和安全性。