Investigating Execution-Aware Language Models for Code Optimization

作者: Federico Di Menna, Luca Traini, Gabriele Bavota, Vittorio Cortellessa

发布时间: 2025-03-12

来源: arxiv

研究方向: 代码优化与语言模型

主要内容

该研究旨在探究将代码执行信息整合到语言模型中,对代码优化能力的影响。研究人员通过训练12种基于CodeT5+的执行感知语言模型,评估了不同代码执行方面和训练策略对代码优化效果的影响。

主要贡献

1. 对12种基于CodeT5+的执行感知语言模型进行了全面评估。

2. 分析了执行感知模型在代码优化中的应用,为未来研究提供了指导。

3. 提供了一个复现包,用于重现研究结果。

研究方法

1. 执行感知预训练

2. 执行感知预训练结合掩码语言模型

3. 执行感知微调

4. 数据集构建

5. 模型训练

6. 模型评估

实验结果

实验结果表明,与标准CodeT5+模型相比,执行感知模型在代码优化方面并没有表现出明显的优势。此外,执行感知模型在生成语义正确的代码方面存在局限性,尽管它们通常能够生成语法正确的程序。

未来工作

未来研究可以探索以下方向:探索更多代码执行方面,利用其他(更大)语言模型,以及尝试不同的训练策略。此外,还可以研究如何提高执行感知模型生成语义正确代码的能力。