Impoola: The Power of Average Pooling for Image-Based Deep Reinforcement Learning
作者: Raphael Trumpp, Ansgar Schäfftlein, Mirco Theile, Marco Caccamo
发布时间: 2025-03-10
来源: arxiv
研究方向: 深度强化学习,特别是基于图像的深度强化学习
主要内容
该论文研究了基于图像的深度强化学习中的网络架构和训练方法,提出了Impoola-CNN模型,通过引入全局平均池化层来提高图像编码器的性能。
主要贡献
1. 提出了Impoola-CNN模型,通过引入全局平均池化层优化了Impala-CNN架构。
2. 在Procgen基准测试中,Impoola-CNN在泛化能力方面优于更大的模型。
3. 分析了GAP层对编码器的影响,发现其降低了网络的平移敏感性。
4. 证明了网络扩展不仅仅是增加模型大小,高效的网络设计也是关键因素。
研究方法
1. 网络架构分析
2. 实验验证
3. 性能评估
4. 对比分析
实验结果
Impoola-CNN在Procgen基准测试中优于Impala-CNN,在泛化能力方面提高了17%,同时参数减少了35%。实验结果表明,GAP层的引入降低了网络的平移敏感性,提高了性能。
未来工作
在未来,计划在Procgen基准测试之外的其他环境中进行实验,例如Atari游戏或真实世界应用,如自动驾驶或视觉引导的四足机器人运动。