Leveraging Large Language Models for Building Interpretable Rule-Based Data-to-Text Systems
作者: Jędrzej Warczyński, Mateusz Lango, Ondrej Dusek
发布时间: 2025-03-03
来源: arxiv
研究方向: 自然语言生成(NLG)和数据到文本(Data-to-Text)
主要内容
本文提出了一种利用大型语言模型(LLM)构建可解释的基于规则的NLG系统的方法。该方法通过让LLM编写Python代码来生成文本,从而实现数据到文本的转换。
主要贡献
1. 提出了一种利用LLM自动生成可解释的基于规则的NLG系统的方法。
2. 通过实验证明了该方法在文本质量和可解释性方面优于传统的基于神经网络的NLG系统。
3. 该方法在处理速度和资源消耗方面具有优势,可以在单CPU上快速生成文本。
研究方法
1. 使用LLM编写Python代码来生成文本。
2. 通过执行生成的代码来验证其正确性。
3. 使用聚类算法来发现可能同时出现的谓词集合,并生成额外的训练示例以提高系统的泛化能力。
实验结果
在WebNLG数据集上的实验结果表明,该方法在BLEU和BLEURT指标上优于基于LLM的NLG系统和微调的BART模型,同时生成更少的幻觉。
未来工作
将合成数据生成扩展到领域外情况,并包含新的规则类型,例如句子级别的规则。