Lost-in-the-Middle in Long-Text Generation: Synthetic Dataset, Evaluation Framework, and Mitigation
作者: Junhao Zhang, Richong Zhang, Fanshuang Kong, Ziyang Miao, Yanhan Ye, Yaowei Zheng
发布时间: 2025-03-11
来源: arxiv
研究方向: 长文本生成与理解
主要内容
本文研究了长文本生成中存在的“中间丢失”问题,并提出了LONGINOUTBENCH基准和RAL-WRITER方法来解决这一问题。LONGINOUTBENCH基准包含长输入和长输出的数据集和评估框架,用于评估长文本生成模型的性能。RAL-WRITER方法通过检索和重述重要内容来缓解“中间丢失”问题。
主要贡献
1. 提出了LONGINOUTBENCH基准,为长输入和长输出任务提供了评估框架和数据集。
2. 开发了RAL-WRITER方法,通过检索和重述重要内容来缓解“中间丢失”问题。
3. 在LONGINOUTBENCH基准上进行了实验,验证了RAL-WRITER方法的有效性。
研究方法
1. LONGINOUTBENCH基准:通过手动收集科学论文,设计长文本写作任务,并建立长度、一致性和质量评估指标。
2. RAL-WRITER方法:包含写作步骤规划器和检索-重述写作者。规划器负责创建写作框架和定义写作步骤,写作者负责检索和重述重要内容。
实验结果
在LONGINOUTBENCH基准上进行的实验表明,RAL-WRITER方法在一致性和质量评估指标上优于基线方法,有效缓解了“中间丢失”问题。
未来工作
未来工作可以进一步研究如何提高RAL-WRITER方法的性能,例如探索更有效的检索和重述机制,以及如何将LONGINOUTBENCH基准应用于其他长文本生成任务。