Ideas in Inference-time Scaling can Benefit Generative Pre-training Algorithms

作者: Jiaming Song, Linqi Zhou

发布时间: 2025-03-12

来源: arxiv

研究方向: 生成式预训练算法与推理时间缩放

主要内容

本文研究了生成式预训练算法在推理时间上的缩放效率,提出了一个以推理时间优先的视角,并以此为基础,探讨了如何通过改进推理过程来提升生成式预训练算法的性能。

主要贡献

1. 提出了一个以推理时间优先的视角,强调了推理时间缩放在生成式预训练算法中的重要性。

2. 通过改进扩散模型的推理过程,提出了Inductive Moment Matching (IMM)算法,实现了更高效的推理。

3. 分析了多令牌预测(MTP)模型的推理设计,指出了其局限性,并提出了改进方案。

4. 提出了未来研究方向,包括进一步探索推理时间缩放在其他生成式预训练算法中的应用,以及如何优化多令牌预测模型等。

研究方法

1. Inductive Moment Matching (IMM)

2. 扩散模型

3. 多令牌预测(MTP)

4. 推理时间缩放

5. 模型容量分析

实验结果

通过实验验证了IMM算法在图像生成任务上的有效性,并展示了其在推理效率上的优势。

未来工作

未来将探索推理时间缩放在其他生成式预训练算法中的应用,以及如何优化多令牌预测模型等。