ICPR 2024 Competition on Rider Intention Prediction

作者: Shankar Gangisetty, Abdul Wasi, Shyam Nandan Rai, C. V. Jawahar, Sajay Raj, Manish Prajapati, Ayesha Choudhary, Aaryadev Chandra, Dev Chandan, Shireen Chand, Suvaditya Mukherjee

发布时间: 2025-03-12

来源: arxiv

研究方向: 智能交通系统与行为预测

主要内容

本文研究了两轮车骑手意图预测问题,旨在通过预测骑手的潜在操作来增强骑手安全。该研究通过收集和创建一个名为RAAD的数据集,并在其中定义了两个任务:单视图(前视图)骑手意图预测和多视图骑手意图预测。

主要贡献

1. 创建了一个新的RAAD数据集,该数据集专门用于预测两轮车骑手的意图。

2. 在RAAD数据集上评估了各种方法,以解决单视图和多视图骑手意图预测任务。

3. 提供了对RAAD数据集的定量基准结果,并展示了Mamba2状态空间模型在骑手意图预测方面的优越性能。

研究方法

1. RAAD数据集的收集和创建:使用三台相机收集了包含多种交通条件和操作的视频。

2. 标注过程:将骑手的意图分为六种操作类别。

3. 单视图骑手意图预测:使用VGG-16、ResNet-50和R(2+1)D三种类型的嵌入特征。

4. 多视图骑手意图预测:结合了前视图、左后视镜视图和右后视镜视图的嵌入特征。

5. 评估指标:使用分类准确性和F1分数来评估预测性能。

6. 方法比较:包括Mamba2状态空间模型、SVM和CNN-LSTM。

实验结果

Mamba2状态空间模型在所有任务和指标上均优于其他方法,尤其是SVM和CNN-LSTM。CNN-LSTM方法在处理小众类别时表现不佳,表明在处理类别不平衡时需要采取额外措施。多视图RIP任务的表现略低于单视图RIP任务。

未来工作

未来研究方向包括:改进和建立竞赛中提出的RIP方法,以及在RAAD数据集中包含长期骑手意图视频,以减少个体行为风格的影响,并提供更真实和有价值的见解。