Prompt Programming: A Platform for Dialogue-based Computational Problem Solving with Generative AI Models

作者: Victor-Alexandru Pădurean, Paul Denny, Alkis Gotovos, Adish Singla

研究方向: 计算机科学与教育

本文介绍了一种名为Prompt Programming的新平台,旨在通过对话式交互,帮助学生与生成式AI模型进行有效的交互,从而解决计算问题。该平台支持多轮对话、多函数问题和按需代码执行,旨在提高学生的编程能力和批判性思维。

ID: 2503.04267v1来源: arxiv发布时间: 2025-03-07

Guidelines for Applying RL and MARL in Cybersecurity Applications

作者: Vasilios Mavroudis, Gregory Palmer, Sara Farmer, Kez Smithson Whitehead, David Foster, Adam Price, Ian Miles, Alberto Caron, Stephen Pasteris

研究方向: 网络安全与强化学习/多智能体强化学习应用

本文主要探讨了在网络安全领域,特别是在自动化网络安全防御(ACD)中应用强化学习(RL)和多智能体强化学习(MARL)的指南。文章详细介绍了RL和MARL的基本概念,评估了其在网络安全问题上的适用性,并分析了在网络安全环境中应用RL和MARL所面临的挑战和机遇。

ID: 2503.04262v1来源: arxiv发布时间: 2025-03-07

VirtualXAI: A User-Centric Framework for Explainability Assessment Leveraging GPT-Generated Personas

作者: Georgios Makridis, Vasileios Koukos, Georgios Fatouros, Dimosthenis Kyriazis

研究方向: 可解释人工智能(XAI)

本文提出了一种名为VirtualXAI的用户中心框架,用于评估XAI方法的可解释性。该框架结合了定量基准测试和定性用户评估,通过虚拟角色来模拟用户反馈,并利用基于内容的推荐系统来匹配数据集、AI模型和XAI方法。

ID: 2503.04261v1来源: arxiv发布时间: 2025-03-08

TAIL: Text-Audio Incremental Learning

作者: Yingfei Sun, Xu Gu, Wei Ji, Hanbin Zhao, Hao Fei, Yifang Yin, Roger Zimmermann

研究方向: 多模态信息检索与增量学习

本文提出了一种名为Text-Audio Incremental Learning (TAIL)的新型增量学习任务,旨在解决文本和音频检索中模型参数效率低和灾难性遗忘的问题。为此,研究者们提出了一种名为PTAT的参数高效框架,该框架利用提示调优和音频-文本相似度与特征蒸馏模块来提高模型性能和泛化能力。

ID: 2503.04258v1来源: arxiv发布时间: 2025-03-07

How to Move Your Dragon: Text-to-Motion Synthesis for Large-Vocabulary Objects

作者: Wonkwang Lee, Jongwon Jeong, Taehong Moon, Hyeon-Jong Kim, Jaehyeon Kim, Gunhee Kim, Byeong-Uk Lee

研究方向: 计算机视觉与图形学

该研究旨在通过文本描述合成多样化的3D物体运动,主要关注如何处理不同骨骼结构对象的运动合成问题。

ID: 2503.04257v1来源: arxiv发布时间: 2025-03-08

Knowledge Retention for Continual Model-Based Reinforcement Learning

作者: Yixiang Sun, Haotian Fu, Michael Littman, George Konidaris

研究方向: 持续模型强化学习(Continual Model-Based Reinforcement Learning)

本文提出了一种名为DRAGO的持续模型强化学习方法,旨在解决在没有先前任务数据的情况下,如何避免灾难性遗忘并学习一个越来越完整的全局模型的问题。该方法通过合成经验重排和通过探索恢复记忆两个关键组件,实现了在一系列任务中增量地开发世界模型。

ID: 2503.04256v1来源: arxiv发布时间: 2025-03-07

How to Mitigate Overfitting in Weak-to-strong Generalization?

作者: Junhao Shi, Qinyuan Cheng, Zhaoye Fei, Yining Zheng, Qipeng Guo, Xipeng Qiu

研究方向: 人工智能与机器学习

本文研究了在弱到强泛化过程中如何减轻过拟合,以提升强模型的泛化能力。弱到强泛化旨在通过弱监督来激发强模型的能力,并确保强模型的行为与弱监督者的意图一致,避免出现欺骗等不安全行为。

ID: 2503.04249v1来源: arxiv发布时间: 2025-03-07

One-Shot Clustering for Federated Learning

作者: Maciej Krzysztof Zuziak, Roberto Pellungrini, Salvatore Rinzivillo

研究方向: 联邦学习(Federated Learning)和聚类联邦学习(Clustered Federated Learning)

本文提出了一种名为One-Shot Clustered Federated Learning (OCFL)的算法,该算法可以在联邦学习的早期阶段自动检测到合适的聚类时刻,并执行高效的单次聚类,无需调整超参数。OCFL算法基于计算客户梯度的余弦相似度和温度度量,用于检测联邦模型何时开始收敛。

ID: 2503.04231v1来源: arxiv发布时间: 2025-03-07

Quantum-Inspired Reinforcement Learning in the Presence of Epistemic Ambivalence

作者: Alireza Habibi, Saeed Ghoorchian, Setareh Maghsudi

研究方向: 量子增强强化学习与认知不确定性

本文研究在存在认知不确定性(认知模糊性)的情况下进行在线决策的复杂性。作者提出了一个名为EA-MDP(认知模糊性马尔可夫决策过程)的新框架,该框架结合了量子力学中的量子状态概念,以理解和控制认知模糊性。该框架使用量子测量技术计算每个可能结果的概率和奖励,并证明了存在最优策略和最优价值函数。此外,还提出了EA-epsilon-greedy Q-learning算法来评估认知模糊性对决策的影响。

ID: 2503.04219v1来源: arxiv发布时间: 2025-03-07

Knowledge-Decoupled Synergetic Learning: An MLLM based Collaborative Approach to Few-shot Multimodal Dialogue Intention Recognition

作者: Bin Chen, Yu Zhang, Hongfei Ye, Ziyi Huang, Hongyang Chen

研究方向: 多模态对话意图识别,特别是在电子商务领域

本文针对电子商务领域中多模态对话意图识别的挑战,提出了一种名为知识解耦协同学习(KDSL)的新方法。该方法通过使用小型模型将知识转化为可解释的规则,并应用大型模型的后续训练,以解决知识干扰和任务不平衡的问题。

ID: 2503.04201v1来源: arxiv发布时间: 2025-03-07