BOSS: Benchmark for Observation Space Shift in Long-Horizon Task
作者: Yue Yang, Linfeng Zhao, Mingyu Ding, Gedas Bertasius, Daniel Szafir
发布时间: 2025-02-25
来源: arxiv
研究方向: 机器人学习与仿学习
主要内容
该论文研究了在机器人长时任务中,由于先前技能执行导致的观察空间变化(OSS)对技能性能的影响。通过构建BOSS基准,评估了不同仿学习算法在长时任务中的表现,并探讨了数据增强方法对缓解OSS问题的有效性。
主要贡献
1. 首次提出了观察空间变化(OSS)的概念,并分析了其在长时机器人任务中的重要性。
2. 引入了BOSS基准,评估了四种仿学习算法在三种不同挑战场景下的性能。
3. 通过规则自动修改生成器(RAMG)创建了大量数据,证明了数据增强方法不足以缓解OSS问题,强调了算法解决方案的必要性。
研究方法
1. 构建了基于Libero模拟平台的BOSS基准,包括三个挑战:单个谓词变化、累积谓词变化和技能链。
2. 评估了四种仿学习算法,包括三种行为克隆方法和一个视觉语言动作模型。
3. 使用规则自动修改生成器(RAMG)生成了多样化的任务数据。
4. 使用比率性能变化(RPD)和链上上限比率(DUBR)等指标评估了算法性能。
实验结果
实验结果表明,OSS对技能性能有显著的负面影响,尤其是在长时任务中。数据增强方法虽然可以提高性能,但不足以完全缓解OSS问题。
未来工作
未来研究需要开发新的算法来有效地解决OSS问题,例如,通过专注于任务相关的视觉线索,或者减少对无关变化的敏感性。此外,需要探索更有效的数据增强方法,以及如何将这些方法应用于实际场景。