Acquiring Grounded Representations of Words with Situated Interactive Instruction

作者: Shiwali Mohan, Aaron H. Mininger, James R. Kirk, John E. Laird

研究方向: 认知系统、语言学习、人机交互

该研究提出了一种通过混合主动的、情境化的交互式指导来获取词语的扎根表示的方法。研究重点是获取包括感知、语义、程序知识和学习扎根意义在内的各种类型知识。通过交互式学习,智能体可以控制其学习,通过请求关于未知概念的指令,使学习更有效。

ID: 2502.20754v1来源: arxiv发布时间: 2025-03-03

Teach-to-Reason with Scoring: Self-Explainable Rationale-Driven Multi-Trait Essay Scoring

作者: Heejin Do, Sangwon Ryu, Gary Geunbae Lee

研究方向: 自然语言处理(NLP)在教育评估中的应用,特别是自动作文评分(AES)系统

本文提出了一种名为RaDME(Rationale-Driven Multi-trait Essay Scoring)的自动作文评分方法,该方法旨在提高AES系统的可解释性和评分准确性。RaDME利用大型语言模型(LLM)的推理能力,通过知识蒸馏将其整合到一个更小、更有效的评分模型中,该模型能够生成评分和相应的理由,从而确保评分决策具有清晰的、可辩护的推理基础。

ID: 2502.20748v1来源: arxiv发布时间: 2025-03-03

Structured Preference Optimization for Vision-Language Long-Horizon Task Planning

作者: Xiwen Liang, Min Lin, Weiqi Ruan, Rongtao Xu, Yuecheng Liu, Jiaqi Chen, Bingqian Lin, Yuzheng Zhuang, Xiaodan Liang

研究方向: 视觉-语言长期任务规划

该研究针对视觉-语言长期任务规划中的难题,提出了一种名为Structured Preference Optimization (SPO)的新框架,旨在通过结构化偏好评估和优化训练策略来提升模型的推理能力和决策质量。

ID: 2502.20742v1来源: arxiv发布时间: 2025-03-03

DeepSolution: Boosting Complex Engineering Solution Design via Tree-based Exploration and Bi-point Thinking

作者: Zhuoqun Li, Haiyang Yu, Xuanang Chen, Hongyu Lin, Yaojie Lu, Fei Huang, Xianpei Han, Yongbin Li, Le Sun

研究方向: 复杂工程解决方案设计

本文提出了一种名为 SolutionRAG 的新型系统,旨在通过树状探索和双点思考机制来生成可靠的复杂工程解决方案。该系统基于 SolutionBench 基准,该基准旨在评估系统生成符合复杂工程要求且具有多个约束条件的完整和可行解决方案的能力。

ID: 2502.20730v1来源: arxiv发布时间: 2025-03-03

NeuroMorse: A Temporally Structured Dataset For Neuromorphic Computing

作者: Ben Walters, Yeshwanth Bethi, Taylor Kergan, Binh Nguyen, Amirali Amirsoleimani, Jason K. Eshraghian, Saeed Afshar, Mostafa Rahimi Azghadi

研究方向: 神经形态计算

本文提出了一种名为NeuroMorse的时序结构化数据集,用于评估神经形态学习系统。该数据集将英语中常用的50个单词转换为时序莫尔斯电码脉冲序列,通过两个输入脉冲通道(点与划)来编码复杂信息。NeuroMorse旨在测试神经形态算法分解输入模式到空间和时序层次结构的能力。

ID: 2502.20729v1来源: arxiv发布时间: 2025-03-03

SPD: Sync-Point Drop for efficient tensor parallelism of Large Language Models

作者: Han-Byul Kim, Duc Hoang, Arnav Kundu, Mohammad Samragh, Minsik Cho

研究方向: 大型语言模型(LLM)的分布式推理优化

该研究提出了一种名为Sync-Point Drop (SPD)的新颖优化技术,用于减少LLM在分布式推理中的通信开销。通过选择性删除注意力输出的同步操作,SPD有效地缓解了通信瓶颈,同时最小化了推理过程中的精度损失。

ID: 2502.20727v1来源: arxiv发布时间: 2025-03-03

Generating Clinically Realistic EHR Data via a Hierarchy- and Semantics-Guided Transformer

作者: Guanglin Zhou, Sebastiano Barbieri

研究方向: 医疗数据生成与隐私保护

本文提出了一种名为HiSGT的层次与语义引导的Transformer模型,用于生成具有高临床真实性的电子健康记录(EHR)数据。该模型结合了临床编码系统的层次结构和预训练临床语言模型提供的丰富语义信息,以生成更符合真实世界临床模式的合成数据。

ID: 2502.20719v1来源: arxiv发布时间: 2025-03-03

Fuzzy Speculative Decoding for a Tunable Accuracy-Runtime Tradeoff

作者: Maximilian Holsman, Yukun Huang, Bhuwan Dhingra

研究方向: 自然语言处理,大语言模型(LLM)推理加速

本文提出了模糊投机解码(FSD),这是一种基于目标模型和草稿模型分布差异的解码算法,旨在提高大语言模型(LLM)的推理速度。FSD 通过允许对目标模型分布的轻微偏离,使用户能够灵活地在生成质量和推理速度之间进行权衡。

ID: 2502.20704v1来源: arxiv发布时间: 2025-03-03

Why Trust in AI May Be Inevitable

作者: Nghi Truong, Phanish Puranam, Ilia Testlin

研究方向: 人工智能与人类交互,知识网络,AI可解释性

本文探讨了在人类与AI交互中,解释的重要性以及信任可能成为替代机制的原因。作者通过构建一个形式化的模型,揭示了即使在理论上理想的条件下,解释也可能失败。这是因为成功解释不仅需要存在共享知识,还需要在时间限制内找到连接路径。这导致人们在面对解释的局限性时,可能会默认选择信任,而不是要求真正的解释。

ID: 2502.20701v1来源: arxiv发布时间: 2025-03-03

ProAI: Proactive Multi-Agent Conversational AI with Structured Knowledge Base for Psychiatric Diagnosis

作者: Yuqi Wu, Guangya Wan, Jingjing Li, Shengming Zhao, Lingfeng Ma, Tianyi Ye, Ion Pop, Yanbo Zhang, Jie Chen

研究方向: 人工智能在精神病学诊断中的应用,特别是基于大型语言模型(LLM)的主动对话式AI系统

本文提出了一种名为ProAI的主动对话式AI框架,用于精神病学诊断。该框架结合了结构化知识库、多智能体主动推理和全方位评估策略,使LLM能够进行类似临床医生的诊断推理,而不仅仅是简单的响应生成。

ID: 2502.20689v1来源: arxiv发布时间: 2025-03-03