MoE-Loco: Mixture of Experts for Multitask Locomotion

作者: Runhan Huang, Shaoting Zhu, Yilun Du, Hang Zhao

发布时间: 2025-03-12

来源: arxiv

研究方向: 机器人运动规划和多任务学习

主要内容

MoE-Loco是一种基于混合专家（MoE）框架的多任务运动规划方法，旨在训练一个能够处理多种地形和运动模式的单一策略，适用于四足机器人。

1. 训练并部署了一个单一的神经网络策略，使四足机器人能够跨越具有挑战性的地形并执行不同的运动模式，包括双足和四足步态。

2. 将MoE架构集成到运动策略训练中，以减轻梯度冲突，提高训练效率和整体模型性能。

3. 对MoE进行了定性和定量分析，揭示了专家的专门化模式。利用这些见解，探讨了MoE在任务迁移和技能组合方面的潜力。

1. 混合专家（MoE）架构

2. 多任务强化学习（MTRL）

3. 概率退火选择（PAS）

4. 近端策略优化（PPO）

5. 技能分解和组合

在模拟和现实世界的部署中，MoE-Loco展示了其鲁棒性和适应性。在模拟实验中，MoE策略在混合任务基准测试中表现最佳。在现实世界实验中，该方法在所有类型任务中均表现出色，特别是在混合地形中，成功率和平均通过时间显著提高。

未来工作将探索将此方法扩展到包含传感器感知（如相机和激光雷达）以增强在更复杂任务中的适应性。