MoE-Loco: Mixture of Experts for Multitask Locomotion

作者: Runhan Huang, Shaoting Zhu, Yilun Du, Hang Zhao

发布时间: 2025-03-12

来源: arxiv

研究方向: 机器人运动规划和多任务学习

主要内容

MoE-Loco是一种基于混合专家(MoE)框架的多任务运动规划方法,旨在训练一个能够处理多种地形和运动模式的单一策略,适用于四足机器人。

主要贡献

1. 训练并部署了一个单一的神经网络策略,使四足机器人能够跨越具有挑战性的地形并执行不同的运动模式,包括双足和四足步态。

2. 将MoE架构集成到运动策略训练中,以减轻梯度冲突,提高训练效率和整体模型性能。

3. 对MoE进行了定性和定量分析,揭示了专家的专门化模式。利用这些见解,探讨了MoE在任务迁移和技能组合方面的潜力。

研究方法

1. 混合专家(MoE)架构

2. 多任务强化学习(MTRL)

3. 概率退火选择(PAS)

4. 近端策略优化(PPO)

5. 技能分解和组合

实验结果

在模拟和现实世界的部署中,MoE-Loco展示了其鲁棒性和适应性。在模拟实验中,MoE策略在混合任务基准测试中表现最佳。在现实世界实验中,该方法在所有类型任务中均表现出色,特别是在混合地形中,成功率和平均通过时间显著提高。

未来工作

未来工作将探索将此方法扩展到包含传感器感知(如相机和激光雷达)以增强在更复杂任务中的适应性。