Rule-Based Conflict-Free Decision Framework in Swarm Confrontation

作者: Zhaoqi Dong, Zhinan Wang, Quanqi Zheng, Bin Xu, Lei Chen, Jinhu Lv

发布时间: 2025-03-11

来源: arxiv

研究方向: 智能无人系统与群体对抗决策

主要内容

本文针对群体对抗场景中的决策抖动和死锁问题,提出了一种基于概率有限状态机、深度卷积网络和强化学习的决策框架,旨在实现智能群体对抗中的可靠和自适应决策。

主要贡献

1. 1. 将常量条件矩阵转换为概率矩阵,通过融合条件特征成功消除了有限状态机中的抖动和死锁问题。

2. 2. 开发了一种深度学习方法来逼近转换概率矩阵,而不是构建其显式形式。

3. 3. 采用强化学习方法优化转换概率矩阵,以提升智能能力,解决内部冲突,并保证决策的准确性。

4. 4. 通过仿真实验和真实实验验证了所提出方法的有效性,并优于其他方法。

研究方法

1. 1. 概率有限状态机(PFSM)

2. 2. 深度卷积网络(CNN)

3. 3. 强化学习(RL)

4. 4. 近端策略优化(PPO)算法

5. 5. 关系注意力机制

实验结果

实验结果表明,所提出的方法在奖励和胜率方面优于基线方法,在大型群体中实现了超过90%的胜率。消融实验验证了每个组件的有效性,将小型群体训练的模型迁移到大型群体中验证了其泛化能力。

未来工作

1. 研究更复杂的群体对抗场景,例如多目标群体对抗。2. 探索更有效的强化学习算法,以进一步提升决策能力。3. 将所提出的方法应用于其他领域,例如无人驾驶和智能交通系统。