Rubrik's Cube: Testing a New Rubric for Evaluating Explanations on the CUBE dataset

作者: Diana Galvan-Sosa, Gabrielle Gaudeau, Pride Kavumba, Yunmeng Li, Hongyi gu, Zheng Yuan, Keisuke Sakaguchi, Paula Buttery

研究方向: 自然语言处理与人工智能

该研究旨在通过设计一个评估框架来评估大型语言模型(LLMs)生成解释的质量,并提出一个名为 Rubrik 的评估工具。Rubrik 的设计基于教育原则,结合了来自教育、可解释人工智能(XAI)和自然语言生成(NLG)领域的见解。

ID: 2503.23899v1来源: arxiv发布时间: 2025-04-03

Better wit than wealth: Dynamic Parametric Retrieval Augmented Generation for Test-time Knowledge Enhancement

作者: Yuqiao Tan, Shizhu He, Huanxuan Liao, Jun Zhao, Kang Liu

研究方向: 自然语言处理,知识增强的生成模型

提出了一种名为Dynamic Parametric RAG (DyPRAG)的轻量级框架,旨在通过将文档直接转换为参数,以插件式的方式在测试时无缝增强大型语言模型(LLM)的知识,同时降低推理、训练和存储成本。

ID: 2503.23895v1来源: arxiv发布时间: 2025-04-03

SpeechDialogueFactory: Generating High-Quality Speech Dialogue Data to Accelerate Your Speech-LLM Development

作者: Minghan Wang, Ye Bai, Yuxia Wang, Thuy-Trang Vu, Ehsan Shareghi, Gholamreza Haffari

研究方向: 语音对话生成与语音语言模型(Speech-LLM)开发

SPEECHDIALOGUEFACTORY是一个用于生成高质量语音对话数据的框架,旨在解决现有语音对话数据集获取方法中存在的局限性,如人力录音成本高、隐私问题以及合成方法缺乏对话真实性。

ID: 2503.23848v1来源: arxiv发布时间: 2025-04-03

Crossing the Reward Bridge: Expanding RL with Verifiable Rewards Across Diverse Domains

作者: Yi Su, Dian Yu, Linfeng Song, Juntao Li, Haitao Mi, Zhaopeng Tu, Min Zhang, Dong Yu

研究方向: 强化学习与可验证奖励(RLVR)在多样化领域中的应用

本文研究了强化学习与可验证奖励(RLVR)在多样化领域中的应用,包括医学、化学、心理学、经济学和教育等,这些领域通常没有结构化的参考答案。研究通过利用生成评分技术来克服二元验证的限制,并展示了一个可扩展的RLVR框架,该框架在自由形式设置中显著优于现有的开源对齐模型。

ID: 2503.23829v2来源: arxiv发布时间: 2025-04-03

Did ChatGPT or Copilot use alter the style of internet news headlines? A time series regression analysis

作者: Chris Brogly, Connor McElroy

研究方向: 人工智能与自然语言处理

本研究旨在探讨大型语言模型(LLMs)如ChatGPT和Copilot的发布是否对互联网新闻标题的写作风格产生了影响。通过分析451百万条新闻标题和链接的175个NLP特征,研究使用中断时间序列分析来评估LLMs发布后是否出现了统计上显著的持续变化。

ID: 2503.23811v2来源: arxiv发布时间: 2025-04-03

ObfusQate: Unveiling the First Quantum Program Obfuscation Framework

作者: Nilhil Bartake, See Toh Zi Jie, Carmen Wong Jiawen, Michael Kasper, Vivek Balachandran

研究方向: 量子计算与软件安全

论文介绍了名为ObfusQate的量子程序混淆框架,该框架利用量子原语来增强经典和量子程序的安全性。ObfusQate支持量子电路级别和代码级别的混淆,包括八种不同的混淆方法。通过使用量子门隐藏、身份矩阵、量子门序列、复合门、遮蔽门、延迟门以及量子纠缠和叠加等量子原理,ObfusQate能够构建复杂、非直观的电路,并操纵程序操作的逻辑序列,从而抵抗逆向工程。

ID: 2503.23785v1来源: arxiv发布时间: 2025-04-02

Who is in Charge here? Understanding How Runtime Configuration Affects Software along with Variables&Constants

作者: Chaopeng Luo, Yuanliang Zhang, Haochen He, Zhouyang Jia, Teng Wang, Shulin Zhou, Si Zheng, Shanshan Li

研究方向: 软件配置与性能

本文研究了运行时配置如何通过参数、常量和变量(PCV)之间的交互影响软件行为。通过对10个大型软件系统中的705个配置参数进行源代码级别的分析,揭示了PCV交互的常见性、类型、模式、影响和潜在问题。

ID: 2503.23774v1来源: arxiv发布时间: 2025-04-02

Biologically Inspired Spiking Diffusion Model with Adaptive Lateral Selection Mechanism

作者: Linghao Feng, Dongcheng Zhao, Sicheng Shen, Yi Zeng

研究方向: 生物启发式神经计算与生成模型

本文提出了一种基于脉冲神经网络(SNNs)的扩散模型,该模型集成了生物启发式的子结构选择机制和侧向连接机制,以提升模型的适应性和表达能力。该模型通过脉冲神经网络处理序列二值脉冲,并结合侧向连接机制迭代地优化子结构选择网络,从而提高模型的适应性和表达能力。

ID: 2503.23767v1来源: arxiv发布时间: 2025-04-02

Beware, PCIe Switches! CXL Pools Are Out to Get You

作者: Yuhong Zhong, Daniel S. Berger, Pantea Zardoshti, Enrique Saurez, Jacob Nelson, Antonis Psistakis, Joshua Fried, Asaf Cidon

研究方向: 数据中心架构与资源管理

本文探讨了使用CXL(Compute Express Link)内存池来实现PCIe设备池化的可能性,以解决数据中心中PCIe设备资源利用率低、成本高和灵活性差的问题。

ID: 2503.23611v1来源: arxiv发布时间: 2025-04-02

Linux for Everyone: Can Standardization Drive Mainstream Adoption?

作者: Rohit J Nandha, Ronak D Patel

研究方向: Linux标准化与主流普及

该研究主要探讨了Linux系统在消费者市场中由于众多发行版、包管理器和桌面环境导致的碎片化问题,分析了标准化对主流普及的影响,并提出了一个平衡的标准化方法,旨在为新手用户提供适应性,为高级用户提供灵活性,同时不牺牲Linux的自由和开放理念。

ID: 2503.23068v1来源: arxiv发布时间: 2025-04-02