AMPLE: Event-Driven Accelerator for Mixed-Precision Inference of Graph Neural Networks
作者: Pedro Gimenes, Yiren Zhao, George Constantinides
发布时间: 2025-03-03
来源: arxiv
研究方向: 图神经网络加速器设计与实现
主要内容
本文研究了图神经网络(GNN)在非欧几里得数据上的性能,并针对GNN在FPGA上的加速提出了AMPLE(Accelerated Message Passing Logic Engine)加速器。AMPLE通过事件驱动编程、混合精度计算和节点预取等技术,实现了对GNN的高效加速。
主要贡献
1. 引入了事件驱动编程模型,实现了对GNN节点异步编程。
2. 提出了混合精度计算架构,支持节点级别的量化。
3. 实现了数据预取器,优化了片外存储访问并最大化节点并行性。
4. 在大型图数据集上实现了平均速度提升243和7.2倍,分别优于CPU和GPU。
5. 首次实现了对节点级别量化的图加速平台,最大化了节点并行性,同时保持了模型精度。
研究方法
1. 事件驱动编程
2. 混合精度计算
3. 节点预取
4. 网络化芯片架构
5. 量化感知训练
实验结果
在多个图数据集上,AMPLE实现了平均速度提升243和7.2倍,分别优于CPU和GPU。实验结果表明,AMPLE在处理大型图数据时,具有显著的优势。
未来工作
未来研究可以进一步优化AMPLE的架构,提高其能效比;同时,可以将AMPLE应用于更多类型的图神经网络,并探索其在其他领域的应用。