Lost-in-the-Middle in Long-Text Generation: Synthetic Dataset, Evaluation Framework, and Mitigation

作者: Junhao Zhang, Richong Zhang, Fanshuang Kong, Ziyang Miao, Yanhan Ye, Yaowei Zheng

发布时间: 2025-03-11

来源: arxiv

研究方向: 长文本生成与理解

主要内容

本文研究了长文本生成中存在的“中间丢失”问题，并提出了LONGINOUTBENCH基准和RAL-WRITER方法来解决这一问题。LONGINOUTBENCH基准包含长输入和长输出的数据集和评估框架，用于评估长文本生成模型的性能。RAL-WRITER方法通过检索和重述重要内容来缓解“中间丢失”问题。

1. 提出了LONGINOUTBENCH基准，为长输入和长输出任务提供了评估框架和数据集。

2. 开发了RAL-WRITER方法，通过检索和重述重要内容来缓解“中间丢失”问题。

3. 在LONGINOUTBENCH基准上进行了实验，验证了RAL-WRITER方法的有效性。

1. LONGINOUTBENCH基准：通过手动收集科学论文，设计长文本写作任务，并建立长度、一致性和质量评估指标。

2. RAL-WRITER方法：包含写作步骤规划器和检索-重述写作者。规划器负责创建写作框架和定义写作步骤，写作者负责检索和重述重要内容。

在LONGINOUTBENCH基准上进行的实验表明，RAL-WRITER方法在一致性和质量评估指标上优于基线方法，有效缓解了“中间丢失”问题。

未来工作可以进一步研究如何提高RAL-WRITER方法的性能，例如探索更有效的检索和重述机制，以及如何将LONGINOUTBENCH基准应用于其他长文本生成任务。