Ride-Sourcing Vehicle Rebalancing with Service Accessibility Guarantees via Constrained Mean-Field Reinforcement Learning
作者: Matej Jusup, Kenan Zhang, Zhiyuan Hu, Barna Pásztor, Andreas Krause, Francesco Corman
发布时间: 2025-04-02
来源: arxiv
研究方向: 出行共享车辆调度与均衡
主要内容
该研究针对出行共享平台(如Uber、Lyft和滴滴出行)中车辆调度与均衡问题,提出了一种基于约束均值场控制(MFC)和强化学习(MFRL)的解决方案,旨在平衡运营效率和公平的服务访问。
主要贡献
1. 提出了一个可扩展的连续状态均值场控制(MFC)和强化学习(MFRL)模型,该模型明确表示每辆车的精确位置并采用连续重新定位动作。
2. 将可访问性约束集成到最优控制公式中,以平衡地理区域间的运营效率和公平访问服务。
3. 放松了传统的均值场假设,更好地反映了实际场景。
4. 使用深圳的真实数据驱动的模拟实验,证明了该方法在处理数万辆车时的实时效率和鲁棒性。
研究方法
1. 均值场控制(MFC)
2. 强化学习(MFRL)
3. 最优传输(OT)
4. 约束优化
5. 模拟实验
实验结果
实验结果表明,与基准方法相比,所提出的方法在系统级和服务质量指标方面表现出更好的性能。此外,该方法还表现出对不可预见的需求模式和供应变化的鲁棒性。
未来工作
未来工作将包括放松集中控制的假设,以考虑个别驾驶员的激励和行为;探索多个服务提供商运营并行车队之间的竞争;将共享随机影响(例如共同噪声)纳入模型,以增强长期决策;以及更深入地研究社会影响问题,例如为弱势群体提供公平的服务访问。