Daily Papers

ChatGPT-4 in the Turing Test: A Critical Analysis

作者: Marco Giunti

研究方向: 人工智能与认知科学

本文对Restrepo Echavarría (2025)的论文《ChatGPT-4 in the Turing Test》进行了批判性分析，探讨了Turing Test在评估大型语言模型（LLMs）认知能力方面的有效性和适用性。

ID: 2503.06551v1•来源: arxiv•发布时间: 2025-03-11

ARMOR v0.1: Empowering Autoregressive Multimodal Understanding Model with Interleaved Multimodal Generation via Asymmetric Synergy

作者: Jianwen Sun, Yukang Feng, Chuanhao Li, Fanrui Zhang, Zizhen Li, Jiaxin Ai, Sizhuo Zhou, Yu Dai, Shenglin Zhang, Kaipeng Zhang

研究方向: 多模态理解与生成

ARMOR是一种资源高效的纯自回归框架，通过微调现有的多模态大型语言模型（MLLMs）来实现理解和生成能力。它通过改进模型架构、训练数据和训练算法三个方面来提升MLLMs的性能，使其能够生成自然交织的文本-图像。

ID: 2503.06542v1•来源: arxiv•发布时间: 2025-03-11

AnywhereDoor: Multi-Target Backdoor Attacks on Object Detection

作者: Jialin Lu, Junjie Shan, Ziqi Zhao, Ka-Ho Chow

研究方向: 网络安全，人工智能，计算机视觉

本文研究了一种名为AnywhereDoor的多目标后门攻击方法，用于对象检测模型。该方法允许攻击者在推理时动态地控制目标模型的行为，包括使对象消失、创建新对象或错误标记对象。

ID: 2503.06529v1•来源: arxiv•发布时间: 2025-03-11

From Motion Signals to Insights: A Unified Framework for Student Behavior Analysis and Feedback in Physical Education Classes

作者: Xian Gao, Jiacheng Ruan, Jingsheng Gao, Mingye Xie, Zongyun Zhang, Ting Liu, Yuzhuo Fu

研究方向: 教育技术，人工智能，运动生理学

提出一种基于运动信号的学生行为分析框架，用于物理教育课程中，通过分析学生的运动信号来优化教学设计和提高教学质量。

ID: 2503.06525v1•来源: arxiv•发布时间: 2025-03-11

Generative AI as Digital Media

作者: Gilad Abiri

研究方向: 数字媒体平台与生成式AI监管

本文探讨了生成式AI作为数字信息平台的角色，分析了其与社交媒体和搜索引擎的相似之处和不同之处，并探讨了当前AI监管方法在促进生成式AI作为可信赖的中间机构的方面的不足。文章提出了将社交媒体监管策略应用于生成式AI的监管，并比较了欧盟的AI法案和数字服务法案，以突出其在监管生成式AI的媒体方面的重要性。

ID: 2503.06523v1•来源: arxiv•发布时间: 2025-03-11

Can Small Language Models Reliably Resist Jailbreak Attacks? A Comprehensive Evaluation

作者: Wenhui Zhang, Huiyu Xu, Zhibo Wang, Zeqing He, Ziqi Zhu, Kui Ren

研究方向: 小语言模型（SLM）的安全性和抗篡改能力

本文研究了小语言模型（SLM）在面临篡改攻击时的脆弱性，特别是针对OWASP将“jailbreak攻击”列为大型语言模型（LLM）的主要威胁之一。通过对63个SLM进行大规模实证研究，评估了其对8种先进的jailbreak方法的敏感性，并分析了影响SLM脆弱性的关键因素。

ID: 2503.06519v1•来源: arxiv•发布时间: 2025-03-11

Towards Superior Quantization Accuracy: A Layer-sensitive Approach

作者: Feng Zhang, Yanbin Liu, Weihua Li, Jie Lv, Xiaodan Wang, Quan Bai

研究方向: 机器学习，量化，大型语言模型

本文提出了一种基于层敏感性的量化方法，通过分析激活敏感性和权重分布的峰度来识别难以准确量化的层，并分配额外的内存预算，从而提高量化精度。

ID: 2503.06518v1•来源: arxiv•发布时间: 2025-03-11

GFlowVLM: Enhancing Multi-step Reasoning in Vision-Language Models with Generative Flow Networks

作者: Haoqiang Kang, Enna Sachdeva, Piyush Gupta, Sangjae Bae, Kwonjoon Lee

研究方向: 视觉语言模型（VLM）与生成流网络（GFlowNets）在多步推理任务中的应用

本文提出了一种名为GFlowVLM的框架，该框架利用生成流网络对VLM进行微调，以促进复杂推理任务中多样化解决方案的生成。GFlowVLM将环境建模为非马尔可夫决策过程，允许其捕获长期依赖关系，这对于现实世界应用至关重要。该框架使用基于任务的奖励来微调VLM，使其能够超越现有的微调方法，包括监督微调（SFT）和强化学习（RL）方法。

ID: 2503.06514v1•来源: arxiv•发布时间: 2025-03-12

HFedCKD: Toward Robust Heterogeneous Federated Learning via Data-free Knowledge Distillation and Two-way Contrast

作者: Yiting Zheng, Bohan Lin, Jinqian Chen, Jihua Zhu

研究方向: 联邦学习（Federated Learning）

本文研究了联邦学习在异构数据和环境下的性能问题，特别是针对低参与率导致的性能下降。提出了一种名为HFedCKD的联邦学习框架，通过数据无关的知识蒸馏和双向对比学习来提高模型性能和稳定性。

ID: 2503.06511v1•来源: arxiv•发布时间: 2025-03-11

LightMotion: A Light and Tuning-free Method for Simulating Camera Motion in Video Generation

作者: Quanjian Song, Zhihang Lin, Zhanpeng Zeng, Ziyue Zhang, Liujuan Cao, Rongrong Ji

研究方向: 视频生成与摄像机运动模拟

该研究提出了一种名为LightMotion的新方法，用于在视频生成中模拟摄像机运动。该方法在潜在空间中操作，无需额外的微调、修复或深度估计，从而比现有方法更加高效。

ID: 2503.06508v2•来源: arxiv•发布时间: 2025-03-12