ValuePilot: A Two-Phase Framework for Value-Driven Decision-Making

作者: Yitong Luo, Hou Hei Lam, Ziang Chen, Zhenliang Zhang, Xue Feng

研究方向: 人工智能与价值驱动决策

ValuePilot是一个两阶段的价值驱动决策框架,旨在解决人工智能在非训练数据集任务中个性化决策的挑战。该框架包括数据生成工具DGT和决策模块DMM,旨在通过模拟真实世界的任务场景和考虑个人价值偏好来提高决策质量。

ID: 2503.04569v1来源: arxiv发布时间: 2025-03-07

Fundamental Limits of Hierarchical Secure Aggregation with Cyclic User Association

作者: Xiang Zhang, Zhou Li, Kai Wan, Hua Sun, Mingyue Ji, Giuseppe Caire

研究方向: 联邦学习(FL)与安全聚合(SA)

本文研究了在分层网络中,通过循环用户-中继关联模式进行的分层安全聚合(HSA)。该研究旨在提高通信效率和密钥生成效率,同时满足服务器安全和中继安全约束。

ID: 2503.04564v2来源: arxiv发布时间: 2025-03-10

Fundamental Limits of Hierarchical Secure Aggregation with Cyclic User Association

作者: Xiang Zhang, Zhou Li, Kai Wan, Hua Sun, Mingyue Ji, Giuseppe Caire

研究方向: 联邦学习、安全聚合、信息论

本文研究了在分层网络中,采用循环关联模式的安全聚合问题。该网络由聚合服务器、中继和用户组成。研究重点关注如何通过增加关联数量B来提高通信和密钥生成效率,同时满足服务器安全和中继安全约束。

ID: 2503.04564v1来源: arxiv发布时间: 2025-03-07

Compositional Causal Reasoning Evaluation in Language Models

作者: Jacqueline R. M. A. Maasch, Alihan Hüyük, Xinnuo Xu, Aditya V. Nori, Javier Gonzalez

研究方向: 语言模型与因果推理

该研究探讨了语言模型在因果推理和组合推理方面的能力,通过引入组合因果推理(CCR)的概念,评估语言模型在推断因果量如何组合以及如何通过图传播因果量方面的能力。

ID: 2503.04556v1来源: arxiv发布时间: 2025-03-07

Benchmarking Reasoning Robustness in Large Language Models

作者: Tong Yu, Yongcheng Jing, Xikun Zhang, Wentao Jiang, Wenjie Wu, Yingjie Wang, Wenbin Hu, Bo Du, Dacheng Tao

研究方向: 大型语言模型(LLMs)的推理鲁棒性

本文研究了大型语言模型在推理任务中的鲁棒性问题,分析了LLMs在推理过程中存在的四个关键局限:位置偏差、指令敏感性、数值脆弱性和内存依赖性。为了解决这些问题,本文提出了一个名为Math-RoB的基准测试框架,用于评估LLMs在数学推理任务中的鲁棒性。

ID: 2503.04550v1来源: arxiv发布时间: 2025-03-07

Keeping Yourself is Important in Downstream Tuning Multimodal Large Language Model

作者: Wenke Huang, Jian Liang, Xianda Guo, Yiyang Fang, Guancheng Wan, Xuankun Rong, Chi Wen, Zekun Shi, Qingyun Li, Didi Zhu, Yanbiao Ma, Ke Liang, Bin Yang, He Li, Jiawei Shao, Mang Ye, Bo Du

研究方向: 多模态大型语言模型(MLLM)的下游微调

本文系统地回顾了近年来MLLM微调方法的最新进展,并将其分类为三种范式:选择性微调、添加性微调和重参数化微调。此外,本文在流行的MLLM架构和多样化的下游任务上对这些微调策略进行了基准测试,以建立标准化的评估分析和系统微调原则。最后,本文强调了该领域的一些开放挑战,并提出了未来的研究方向。

ID: 2503.04543v1来源: arxiv发布时间: 2025-03-07

SOLAR: Scalable Optimization of Large-scale Architecture for Reasoning

作者: Chen Li, Yinyi Luo, Anudeep Bolimera, Marios Savvides

研究方向: 大型语言模型(LLM)推理优化与拓扑结构自适应

本文提出了一种名为SOLAR的框架,旨在优化大型语言模型在推理任务中的表现。SOLAR通过动态优化推理拓扑结构,包括树和图,来提高准确性和效率。它引入了Topological-Annotation-Generation(TAG)系统来自动化拓扑数据集的创建和分割,以及Topological-Scaling框架,以实现训练和推理缩放的同步。

ID: 2503.04530v1来源: arxiv发布时间: 2025-03-07

Dynamic Pricing for On-Demand DNN Inference in the Edge-AI Market

作者: Songyuan Li, Jia Hu, Geyong Min, Haojun Huang, Jiwei Huang

研究方向: 边缘人工智能(Edge-AI)市场中的动态定价与深度神经网络(DNN)推理加速

本文针对边缘人工智能市场中的动态定价问题,提出了一种基于拍卖机制的边缘推理定价机制(AERIA),旨在通过多维度优化,实现DNN模型分区、边缘推理定价和资源分配的最优化,以实现收益最大化。

ID: 2503.04521v1来源: arxiv发布时间: 2025-03-07

STX-Search: Explanation Search for Continuous Dynamic Spatio-Temporal Models

作者: Saif Anwar, Nathan Griffiths, Thomas Popham, Abhir Bhalerao

研究方向: 机器学习,可解释人工智能,时空数据建模

STX-Search是一种针对连续动态时空模型生成实例级解释的方法,旨在解决现有方法在解释连续时间动态图数据时的计算复杂性和解释目标不足的问题。

ID: 2503.04509v1来源: arxiv发布时间: 2025-03-07

Multi-modal Summarization in Model-Based Engineering: Automotive Software Development Case Study

作者: Nenad Petrovic, Yurui Zhang, Moaad Maaroufi, Kuo-Yi Chao, Lukasz Mazur, Fengjunjie Pan, Vahid Zolfaghari, Alois Knoll

研究方向: 多模态总结在基于模型工程中的应用

本文研究了多模态总结在基于模型工程(MBE)中的应用,特别是针对汽车软件开发领域。通过使用大型语言模型(LLM)来分析和理解UML和EMF图中的多模态信息,旨在提高MBE实践中的生产力和准确性。

ID: 2503.04506v1来源: arxiv发布时间: 2025-03-07