ARIES: Autonomous Reasoning with LLMs on Interactive Thought Graph Environments

作者: Pedro Gimenes, Zeyu Cao, Jeffrey Wong, Yiren Zhao

发布时间: 2025-03-03

来源: arxiv

研究方向: 大型语言模型（LLM）在推理任务中的应用

主要内容

本文提出了一种名为ARIES的多智能体架构，旨在利用大型语言模型（LLM）在推理任务中的能力。ARIES通过将思维图转换视为马尔可夫决策过程中的动作，实现政策智能体来驱动推理智能体的有效动作策略。

1. 引入了ARIES，一种用于自主拓扑推理的新型方法，使整个推理任务都由LLM引导。

2. 证明了LLM具有规划能力，可以作为拓扑推理任务中的政策智能体，从而消除了对推理智能体预先设定的、特定于任务的调度方案的需求。

3. 在一系列基准测试中展示了LLM引导的思维图探索如何提高至高达29%的准确率，同时将推理成本降低35%，并避免了任何贝叶斯搜索成本。

1. 将思维图转换视为马尔可夫决策过程中的动作。

2. 实现政策智能体来驱动推理智能体的有效动作策略。

3. 使用LLM作为政策智能体，无需监督微调（SFT）。

4. 使用多智能体架构，其中推理LLM智能体解决分解的子问题，而策略LLM智能体维护思维图状态的可视性，并动态调整问题解决策略。

5. 使用政策智能体集合来减少随机性并提高决策的稳定性。

实验结果表明，与静态转换方案相比，使用现成的LLM作为政策智能体可以显著提高准确率并降低推理成本。此外，还发现LLM参数大小和问题分解的深度是影响LLM引导推理的扩展性的主要因素。

未来工作可以探索以下方面：1）将ARIES应用于更广泛的推理任务和领域；2）研究如何进一步提高LLM作为政策智能体的性能；3）探索如何降低LLM推理的成本和能耗。