Acquiring Grounded Representations of Words with Situated Interactive Instruction

作者: Shiwali Mohan, Aaron H. Mininger, James R. Kirk, John E. Laird

发布时间: 2025-03-03

来源: arxiv

研究方向: 认知系统、语言学习、人机交互

主要内容

该研究提出了一种通过混合主动的、情境化的交互式指导来获取词语的扎根表示的方法。研究重点是获取包括感知、语义、程序知识和学习扎根意义在内的各种类型知识。通过交互式学习,智能体可以控制其学习,通过请求关于未知概念的指令,使学习更有效。

主要贡献

1. 提出了一种通过交互式指导获取词语扎根表示的方法。

2. 实现了基于Soar的认知架构,并将其应用于一个桌面机器人臂。

3. 验证了该方法在感知、语义和程序知识获取方面的有效性。

4. 证明了交互式指导在灵活性和效率方面的优势。

研究方法

1. 使用Soar认知架构开发智能体。

2. 通过交互式指导学习词语的感知、语义和程序知识。

3. 使用K-Nearest Neighbor (KNN) 分类器进行感知特征分类。

4. 使用混合主动交互模型进行人机交互。

5. 使用Chunking机制学习动作执行知识。

6. 使用语义记忆存储语言映射知识。

7. 使用情景记忆存储与经验相关的知识。

实验结果

实验结果表明,该智能体能够通过交互式指导快速、有效地学习各种类型知识。智能体在感知、语义和程序知识获取方面的表现均达到了预期目标。

未来工作

未来工作将集中在扩展任务复杂性和指令类型、提高对指令错误的鲁棒性、处理感知不确定性以及从历史或假设情境中学习等方面。