Ideas in Inference-time Scaling can Benefit Generative Pre-training Algorithms

作者: Jiaming Song, Linqi Zhou

发布时间: 2025-03-12

来源: arxiv

研究方向: 生成式预训练算法与推理时间缩放

主要内容

本文研究了生成式预训练算法在推理时间上的缩放效率，提出了一个以推理时间优先的视角，并以此为基础，探讨了如何通过改进推理过程来提升生成式预训练算法的性能。

1. 提出了一个以推理时间优先的视角，强调了推理时间缩放在生成式预训练算法中的重要性。

2. 通过改进扩散模型的推理过程，提出了Inductive Moment Matching (IMM)算法，实现了更高效的推理。

3. 分析了多令牌预测（MTP）模型的推理设计，指出了其局限性，并提出了改进方案。

4. 提出了未来研究方向，包括进一步探索推理时间缩放在其他生成式预训练算法中的应用，以及如何优化多令牌预测模型等。

1. Inductive Moment Matching (IMM)

2. 扩散模型

3. 多令牌预测（MTP）

4. 推理时间缩放

5. 模型容量分析

通过实验验证了IMM算法在图像生成任务上的有效性，并展示了其在推理效率上的优势。

未来将探索推理时间缩放在其他生成式预训练算法中的应用，以及如何优化多令牌预测模型等。