MoE-Loco: Mixture of Experts for Multitask Locomotion
作者: Runhan Huang, Shaoting Zhu, Yilun Du, Hang Zhao
发布时间: 2025-03-12
来源: arxiv
研究方向: 机器人运动规划和多任务学习
主要内容
MoE-Loco是一种基于混合专家(MoE)框架的多任务运动规划方法,旨在训练一个能够处理多种地形和运动模式的单一策略,适用于四足机器人。
主要贡献
1. 训练并部署了一个单一的神经网络策略,使四足机器人能够跨越具有挑战性的地形并执行不同的运动模式,包括双足和四足步态。
2. 将MoE架构集成到运动策略训练中,以减轻梯度冲突,提高训练效率和整体模型性能。
3. 对MoE进行了定性和定量分析,揭示了专家的专门化模式。利用这些见解,探讨了MoE在任务迁移和技能组合方面的潜力。
研究方法
1. 混合专家(MoE)架构
2. 多任务强化学习(MTRL)
3. 概率退火选择(PAS)
4. 近端策略优化(PPO)
5. 技能分解和组合
实验结果
在模拟和现实世界的部署中,MoE-Loco展示了其鲁棒性和适应性。在模拟实验中,MoE策略在混合任务基准测试中表现最佳。在现实世界实验中,该方法在所有类型任务中均表现出色,特别是在混合地形中,成功率和平均通过时间显著提高。
未来工作
未来工作将探索将此方法扩展到包含传感器感知(如相机和激光雷达)以增强在更复杂任务中的适应性。