Uncertainty in Action: Confidence Elicitation in Embodied Agents

作者: Tianjiao Yu, Vedant Shah, Muntasir Wahed, Kiet A. Nguyen, Adheesh Juvekar, Tal August, Ismini Lourentzou

发布时间: 2025-03-15

来源: arxiv

研究方向: 机器学习，人工智能，不确定性量化

主要内容

该研究旨在解决在动态多模态环境中，具身智能体表达不确定性的挑战。研究人员提出了一个框架，通过引入检索策略和执行策略来增强具身智能体的置信度估计。

1. 提出了一个具身语言化置信度检索框架。

2. 引入了检索策略和执行策略来增强置信度估计。

3. 对具身不确定性进行了结构化分析，并确定了提高置信度校准和失败预测的有效方法。

4. 识别了具身置信度检索中的持续挑战。

1. 检索策略：包括Vanilla、Self-Intervention、Chain-of-Thought (CoT)、Plan & Solve (P&S) 和 Top-K。

2. 执行策略：包括Action Sampling、Scenario Reinterpretation 和 Hypothetical Reasoning。

3. 实验：在Minecraft环境中进行的校准和失败预测任务。

实验结果表明，检索策略和执行策略都有助于提高置信度校准和失败预测。其中，结构化推理方法（如CoT和P&S）表现最佳。然而，归纳推理和演绎推理比归纳推理更具挑战性，而归纳推理的置信度校准和任务成功率之间存在显著差异。

未来的工作可以扩展到更复杂和多样化的环境中，并探索与各种具身智能体架构的集成。此外，需要进一步研究如何提高具身智能体在不确定性量化方面的能力，以实现更安全的AI部署。