PASemiQA: Plan-Assisted Agent for Question Answering on Semi-Structured Data with Text and Relational Information
作者: Hansi Yang, Qi Zhang, Wei Jiang, Jianguo Li
发布时间: 2025-03-03
来源: arxiv
研究方向: 自然语言处理,问答系统,半结构化数据
主要内容
该研究提出了一种名为 PASemiQA 的方法,用于在半结构化数据上通过文本和关系信息进行问答。PASemiQA 通过生成计划来识别相关的文本和关系信息,然后使用大型语言模型 (LLM) 代理遍历半结构化数据并提取必要的信息。
主要贡献
1. 提出了一种新的规划模块,可以生成包含关系和文本信息的问答计划。
2. 提出了一种代理框架,可以根据生成的计划遍历半结构化数据以提取相关信息。
3. 通过不同领域的半结构化数据集上的实证结果证明了所提出方法的有效性。
研究方法
1. 规划生成:使用文本匹配和嵌入相似性来识别相关节点,并使用概率模型来生成关系路径。
2. 图遍历代理:使用 LLM 代理执行搜索、查询和完成等操作,以遍历半结构化数据并提取相关信息。
3. 算法:结合规划生成和图遍历代理,实现了 PASemiQA 的完整算法。
实验结果
在来自不同领域的三个半结构化数据集上的实验结果表明,PASemiQA 在准确性和延迟方面优于基线方法。此外,消融实验表明,PASemiQA 的性能对超参数敏感度较低。
未来工作
未来的工作可以集中在以下几个方面:针对特定领域的半结构化数据训练专门的 LLM 代理,优化规划生成模块,以及研究更有效的图遍历代理。