VB-Com: Learning Vision-Blind Composite Humanoid Locomotion Against Deficient Perception

作者: Junli Ren, Tao Huang, Huayi Wang, Zirui Wang, Qingwei Ben, Jiangmiao Pang, Ping Luo

发布时间: 2025-02-24

来源: arxiv

研究方向: 机器人运动控制与感知

主要内容

该研究提出了一种名为VB-Com的复合人形机器人运动控制框架,该框架结合了视觉政策和盲政策的优势,以增强人形机器人在动态、无结构环境中的运动性能。VB-Com能够根据感知缺陷动态切换视觉和盲政策,使机器人在复杂地形中更有效地导航。

主要贡献

1. 提出了一个感知和非感知的人形机器人运动政策,可以穿越缝隙、障碍物和避开障碍物。

2. 开发了一个新颖的硬件可部署的回报估计器,可以根据当前的本体感知状态预测当前策略实现的未来回报。

3. 设计了一个双政策组合系统,将视觉和盲政策集成,以实现通过动态障碍物和地形的鲁棒运动,即使在机载传感器提供不足的外部感知的情况下也能保持稳定的运动。

研究方法

1. 强化学习

2. 近端策略优化(PPO)

3. Q值政策组合

4. 回报估计

5. 视觉感知

6. 本体感知

实验结果

实验结果表明,VB-Com在处理感知缺陷时表现出快速响应能力。在具有挑战性的地形上,VB-Com在避免碰撞和完成任务方面优于仅使用视觉或盲政策的基线方法。在真实机器人上的部署进一步证明了VB-Com的实用性和有效性。

未来工作

未来的工作将探索引入额外的子策略,以更好地处理类似挑战的场景,并进一步提高系统的鲁棒性。此外,研究还将探索如何将VB-Com扩展到更复杂的动态环境和更广泛的机器人平台上。