Position: Graph Learning Will Lose Relevance Due To Poor Benchmarks

作者: Maya Bechler-Speicher, Ben Finkelshtein, Fabrizio Frasca, Luis Müller, Jan Tönshoff, Antoine Siraudin, Viktor Zaverkin, Michael M. Bronstein, Mathias Niepert, Bryan Perozzi, Mikhail Galkin, Christopher Morris

研究方向: 图学习

该论文探讨了当前图学习领域中存在的基准测试问题,并提出了改进建议,旨在推动图学习研究的进一步发展和应用。

ID: 2502.14546v1来源: arxiv发布时间: 2025-02-24

Beyond Self-Talk: A Communication-Centric Survey of LLM-Based Multi-Agent Systems

作者: Bingyu Yan, Xiaoming Zhang, Litian Zhang, Lian Zhang, Ziyi Zhou, Dezhuang Miao, Chaozhuo Li

研究方向: 基于大型语言模型的多人协同系统

本文综述了基于大型语言模型(LLM)的多人协同系统(LLM-MAS)的研究进展,从通信角度分析了LLM-MAS的架构设计、通信目标、内部机制以及面临的挑战和未来研究方向。

ID: 2502.14321v1来源: arxiv发布时间: 2025-02-24

Effects of Prompt Length on Domain-specific Tasks for Large Language Models

作者: Qibang Liu, Wenzhe Wang, Jeffrey Willard

研究方向: 自然语言处理,大型语言模型(LLMs)在特定领域任务中的应用

该研究旨在探究提示长度对大型语言模型在特定领域任务(如金融情绪分析、货币政策理解等)中的性能影响。

ID: 2502.14255v1来源: arxiv发布时间: 2025-02-24

Causal Mean Field Multi-Agent Reinforcement Learning

作者: Hao Ma, Zhiqiang Pu, Yi Pan, Boyin Liu, Junlong Gao, Zhenyu Guo

研究方向: 多智能体强化学习(MARL)

本文针对多智能体强化学习中可扩展性问题,提出了一种名为因果均值场Q学习(CMFQ)的算法。该算法通过引入因果推理,解决了现有均值场强化学习(MFRL)在非平稳环境中无法识别关键交互的问题,从而提高了算法的鲁棒性和可扩展性。

ID: 2502.14200v1来源: arxiv发布时间: 2025-02-24

Multi-Agent Risks from Advanced AI

作者: Lewis Hammond, Alan Chan, Jesse Clifton, Jason Hoelscher-Obermaier, Akbir Khan, Euan McLean, Chandler Smith, Wolfram Barfuss, Jakob Foerster, Tomáš Gavenčiak, The Anh Han, Edward Hughes, Vojtěch Kovařík, Jan Kulveit, Joel Z. Leibo, Caspar Oesterheld, Christian Schroeder de Witt, Nisarg Shah, Michael Wellman, Paolo Bova, Theodor Cimpeanu, Carson Ezell, Quentin Feuillade-Montixi, Matija Franklin, Esben Kran, Igor Krawczuk, Max Lamparth, Niklas Lauffer, Alexander Meinke, Sumeet Motwani, Anka Reuel, Vincent Conitzer, Michael Dennis, Iason Gabriel, Adam Gleave, Gillian Hadfield, Nika Haghtalab, Atoosa Kasirzadeh, Sébastien Krier, Kate Larson, Joel Lehman, David C. Parkes, Georgios Piliouras, Iyad Rahwan

研究方向: 多智能体系统中的高级AI风险

本文分析了高级AI智能体在多智能体系统中的潜在风险,包括失调、冲突和勾结三种失败模式,并提出了七种关键风险因素,如信息不对称、网络效应、选择压力等。文章还讨论了这些风险对AI安全、治理和伦理的潜在影响,并提出了缓解这些风险的策略。

ID: 2502.14143v1来源: arxiv发布时间: 2025-02-24

Benchmarking LLMs for Political Science: A United Nations Perspective

作者: Yueqing Liang, Liangwei Yang, Chen Wang, Congying Xia, Rui Meng, Xiongxiao Xu, Haoran Wang, Ali Payani, Kai Shu

研究方向: 人工智能与政治科学交叉领域

本文研究了大型语言模型(LLMs)在联合国决策过程中的应用,通过构建UNBench基准,评估LLMs在政治科学领域的潜力与挑战。

ID: 2502.14122v1来源: arxiv发布时间: 2025-02-24

Dynamic Activation with Knowledge Distillation for Energy-Efficient Spiking NN Ensembles

作者: Orestis Konstantaropoulos, Theodoris Mallios, Maria Papadopouli

研究方向: 神经网络与人工智能

本文提出了一种名为Spiking Neural Ensemble (SNE)的新型系统,旨在通过结合知识蒸馏和集成学习来缩小人工神经网络 (ANN) 和脉冲神经网络 (SNN) 之间的性能差距。该系统利用一个基础AI模型作为教师网络,指导一组较小的学生SNN形成脉冲神经网络集成 (SNE),以实现高精度和低能耗。

ID: 2502.14023v1来源: arxiv发布时间: 2025-02-24

Cascading CMA-ES Instances for Generating Input-diverse Solution Batches

作者: Maria Laura Santoni, Christoph Dürr, Carola Doerr, Mike Preuss, Elena Raponi

研究方向: 优化算法与进化计算

该论文提出了一种基于CMA-ES算法的CMA-ES-Diversity Search (CMAES-DS) 算法,旨在生成具有高质量和多样性的解决方案批次,同时确保最佳解决方案的质量不受损害。该算法通过并行运行CMA-ES实例并继承禁忌区域来促进多样性。

ID: 2502.13730v1来源: arxiv发布时间: 2025-02-24

Emergence of the Primacy Effect in Structured State-Space Models

作者: Takashi Morita

研究方向: 机器学习、认知神经科学、时间序列处理

本文研究了结构化状态空间模型(SSM)在记忆任务中的表现,并发现该模型在记忆验证任务中表现出与人类和动物记忆相似的优先效应,即对序列开头和结尾的项目记忆更准确。

ID: 2502.13729v2来源: arxiv发布时间: 2025-02-24