Experimental Exploration: Investigating Cooperative Interaction Behavior Between Humans and Large Language Model Agents

作者: Guanxuan Jiang, Yuyang Wang, Pan Hui

研究方向: 人工智能与人类交互

本研究通过实验探究了人类与大型语言模型(LLM)代理在竞争合作场景中的交互行为,特别是当代理展现出不同特征(拟人化人类、基于规则的AI代理和LLM代理)时,人类的合作行为如何受到影响。

ID: 2503.07320v1来源: arxiv发布时间: 2025-03-11

Human Machine Co-Adaptation Model and Its Convergence Analysis

作者: Steven W. Su, Yaqi Li, Kairui Guo, Rob Duffield

研究方向: 机器人辅助康复和强化学习

该研究提出了一种名为协同自适应马尔可夫决策过程(CAMDP)的新框架,用于提高机器人辅助康复中的交互式学习过程。通过建立双代理学习模型,研究确定了收敛的理论条件,并提供了确保纳什均衡点唯一性的见解。

ID: 2503.07319v1来源: arxiv发布时间: 2025-03-11

Self-Corrective Task Planning by Inverse Prompting with Large Language Models

作者: Jiho Lee, Hayun Lee, Jonghyeon Kim, Kyungjae Lee, Eunwoo Kim

研究方向: 机器人任务规划与大型语言模型(LLM)

本文提出了一种名为InversePrompt的基于逆提示的自我纠正任务规划方法,用于解决大型语言模型在机器人任务规划中生成的计划可能不准确的问题。该方法通过引入多步推理过程,对生成的计划进行验证和修正,从而提高计划的准确性和可解释性。

ID: 2503.07317v1来源: arxiv发布时间: 2025-03-11

Group-robust Sample Reweighting for Subpopulation Shifts via Influence Functions

作者: Rui Qiao, Zhaoxuan Wu, Jingtan Wang, Pang Wei Koh, Bryan Kian Hsiang Low

研究方向: 机器学习中的群体鲁棒性

该研究提出了一种名为 Group-robust Sample Reweighting (GSR) 的方法,旨在提高机器学习模型对群体偏移的鲁棒性。GSR 通过利用群体标签数据来优化未标记数据的权重,从而提高模型的泛化能力。

ID: 2503.07315v1来源: arxiv发布时间: 2025-03-11

Distilling Knowledge into Quantum Vision Transformers for Biomedical Image Classification

作者: Thomas Boucher, Evangelos B. Mazomenos

研究方向: 生物医学图像分类与量子机器学习

本文研究了利用量子视觉Transformer(QViT)进行生物医学图像分类的方法,将量子神经网络(QNN)集成到视觉Transformer中,以实现参数高效的特征表示,并使用知识蒸馏(KD)技术提高模型性能。

ID: 2503.07294v1来源: arxiv发布时间: 2025-03-11

VizTrust: A Visual Analytics Tool for Capturing User Trust Dynamics in Human-AI Communication

作者: Xin Wang, Stephanie Tulk Jesso, Sadamori Kojaku, David M Neyens, Min Sun Kim

研究方向: 人机交互、自然语言处理、可视化分析

VizTrust是一个基于Web的应用程序,旨在通过实时分析和可视化,捕捉和评估用户在与人工智能系统(AI)的交互过程中对AI的信任动态。该工具基于四个信任维度:能力、诚信、仁慈和可预测性,并结合自然语言处理和机器学习技术,以提供对用户信任形成和演变的深入理解。

ID: 2503.07279v1来源: arxiv发布时间: 2025-03-11

Automatic Curriculum Design for Zero-Shot Human-AI Coordination

作者: Won-Sang You, Tae-Gwan Ha, Seo-Young Lee, Kyung-Joong Kim

研究方向: 人工智能与人类协作

本文研究的是零样本人机协作,即在没有任何人类数据的情况下训练一个ego-agent与人类进行协作。传统的零样本人机协作方法主要集中在提升ego-agent在特定环境中的协作能力,而忽略了其在未见环境中的泛化能力。本文提出了一种基于多智能体无监督环境设计(UED)的自动课程设计方法,通过引入基于回报的效用函数和协同玩家采样,有效地训练ego-agent与人类在多样环境中进行协作。

ID: 2503.07275v1来源: arxiv发布时间: 2025-03-11

Federated Learning in NTNs: Design, Architecture and Challenges

作者: Amin Farajzadeh, Animesh Yadav, Halim Yanikomeroglu

研究方向: 非地面网络(NTN)与联邦学习(FL)的结合与应用

本文研究将联邦学习应用于非地面网络(NTN)中,提出了一种分布式分层联邦学习(HFL)框架,利用高空平台站(HAPS)星座作为中间分布式FL服务器,以实现低延迟、高精度、可扩展的全球规模学习。

ID: 2503.07272v1来源: arxiv发布时间: 2025-03-11

WISE: A World Knowledge-Informed Semantic Evaluation for Text-to-Image Generation

作者: Yuwei Niu, Munan Ning, Mengren Zheng, Bin Lin, Peng Jin, Jiaqi Liao, Kunpeng Ning, Bin Zhu, Li Yuan

研究方向: 文本到图像生成(Text-to-Image, T2I)模型的世界知识与语义理解评估

本文提出了一种名为WISE(World Knowledge-Informed Semantic Evaluation)的评估基准,旨在全面评估T2I模型在语义理解和世界知识整合方面的能力。WISE通过1000个精心设计的提示,涵盖了25个子领域,包括文化常识、时空推理和自然科学,以此来挑战模型对复杂语义的理解和图像生成能力。

ID: 2503.07265v1来源: arxiv发布时间: 2025-03-11

COMODO: Cross-Modal Video-to-IMU Distillation for Efficient Egocentric Human Activity Recognition

作者: Baiyu Chen, Wilson Wongso, Zechen Li, Yonchanok Khaokaew, Hao Xue, Flora Salim

研究方向: 人机交互,可穿戴设备,人类活动识别

本文提出了一种名为COMODO的跨模态自监督蒸馏框架,用于提高基于IMU的人类活动识别(HAR)的效率。该框架通过将视频模态中的丰富语义知识转移到IMU模态,实现了在不依赖标注数据的情况下,从视频到IMU的知识迁移。

ID: 2503.07259v1来源: arxiv发布时间: 2025-03-11