Ride-Sourcing Vehicle Rebalancing with Service Accessibility Guarantees via Constrained Mean-Field Reinforcement Learning

作者: Matej Jusup, Kenan Zhang, Zhiyuan Hu, Barna Pásztor, Andreas Krause, Francesco Corman

发布时间: 2025-04-02

来源: arxiv

研究方向: 出行共享车辆调度与均衡

主要内容

该研究针对出行共享平台(如Uber、Lyft和滴滴出行)中车辆调度与均衡问题,提出了一种基于约束均值场控制(MFC)和强化学习(MFRL)的解决方案,旨在平衡运营效率和公平的服务访问。

主要贡献

1. 提出了一个可扩展的连续状态均值场控制(MFC)和强化学习(MFRL)模型,该模型明确表示每辆车的精确位置并采用连续重新定位动作。

2. 将可访问性约束集成到最优控制公式中,以平衡地理区域间的运营效率和公平访问服务。

3. 放松了传统的均值场假设,更好地反映了实际场景。

4. 使用深圳的真实数据驱动的模拟实验,证明了该方法在处理数万辆车时的实时效率和鲁棒性。

研究方法

1. 均值场控制(MFC)

2. 强化学习(MFRL)

3. 最优传输(OT)

4. 约束优化

5. 模拟实验

实验结果

实验结果表明,与基准方法相比,所提出的方法在系统级和服务质量指标方面表现出更好的性能。此外,该方法还表现出对不可预见的需求模式和供应变化的鲁棒性。

未来工作

未来工作将包括放松集中控制的假设,以考虑个别驾驶员的激励和行为;探索多个服务提供商运营并行车队之间的竞争;将共享随机影响(例如共同噪声)纳入模型,以增强长期决策;以及更深入地研究社会影响问题,例如为弱势群体提供公平的服务访问。