ARIES: Autonomous Reasoning with LLMs on Interactive Thought Graph Environments

作者: Pedro Gimenes, Zeyu Cao, Jeffrey Wong, Yiren Zhao

发布时间: 2025-03-03

来源: arxiv

研究方向: 大型语言模型(LLM)在推理任务中的应用

主要内容

本文提出了一种名为ARIES的多智能体架构,旨在利用大型语言模型(LLM)在推理任务中的能力。ARIES通过将思维图转换视为马尔可夫决策过程中的动作,实现政策智能体来驱动推理智能体的有效动作策略。

主要贡献

1. 引入了ARIES,一种用于自主拓扑推理的新型方法,使整个推理任务都由LLM引导。

2. 证明了LLM具有规划能力,可以作为拓扑推理任务中的政策智能体,从而消除了对推理智能体预先设定的、特定于任务的调度方案的需求。

3. 在一系列基准测试中展示了LLM引导的思维图探索如何提高至高达29%的准确率,同时将推理成本降低35%,并避免了任何贝叶斯搜索成本。

研究方法

1. 将思维图转换视为马尔可夫决策过程中的动作。

2. 实现政策智能体来驱动推理智能体的有效动作策略。

3. 使用LLM作为政策智能体,无需监督微调(SFT)。

4. 使用多智能体架构,其中推理LLM智能体解决分解的子问题,而策略LLM智能体维护思维图状态的可视性,并动态调整问题解决策略。

5. 使用政策智能体集合来减少随机性并提高决策的稳定性。

实验结果

实验结果表明,与静态转换方案相比,使用现成的LLM作为政策智能体可以显著提高准确率并降低推理成本。此外,还发现LLM参数大小和问题分解的深度是影响LLM引导推理的扩展性的主要因素。

未来工作

未来工作可以探索以下方面:1)将ARIES应用于更广泛的推理任务和领域;2)研究如何进一步提高LLM作为政策智能体的性能;3)探索如何降低LLM推理的成本和能耗。