Ride-Sourcing Vehicle Rebalancing with Service Accessibility Guarantees via Constrained Mean-Field Reinforcement Learning

作者: Matej Jusup, Kenan Zhang, Zhiyuan Hu, Barna Pásztor, Andreas Krause, Francesco Corman

发布时间: 2025-04-02

来源: arxiv

研究方向: 出行共享车辆调度与均衡

主要内容

该研究针对出行共享平台（如Uber、Lyft和滴滴出行）中车辆调度与均衡问题，提出了一种基于约束均值场控制（MFC）和强化学习（MFRL）的解决方案，旨在平衡运营效率和公平的服务访问。

1. 提出了一个可扩展的连续状态均值场控制（MFC）和强化学习（MFRL）模型，该模型明确表示每辆车的精确位置并采用连续重新定位动作。

2. 将可访问性约束集成到最优控制公式中，以平衡地理区域间的运营效率和公平访问服务。

3. 放松了传统的均值场假设，更好地反映了实际场景。

4. 使用深圳的真实数据驱动的模拟实验，证明了该方法在处理数万辆车时的实时效率和鲁棒性。

1. 均值场控制（MFC）

2. 强化学习（MFRL）

3. 最优传输（OT）

4. 约束优化

5. 模拟实验

实验结果表明，与基准方法相比，所提出的方法在系统级和服务质量指标方面表现出更好的性能。此外，该方法还表现出对不可预见的需求模式和供应变化的鲁棒性。

未来工作将包括放松集中控制的假设，以考虑个别驾驶员的激励和行为；探索多个服务提供商运营并行车队之间的竞争；将共享随机影响（例如共同噪声）纳入模型，以增强长期决策；以及更深入地研究社会影响问题，例如为弱势群体提供公平的服务访问。