ChatGPT-4 in the Turing Test: A Critical Analysis

作者: Marco Giunti

研究方向: 人工智能与认知科学

本文对Restrepo Echavarría (2025)的论文《ChatGPT-4 in the Turing Test》进行了批判性分析,探讨了Turing Test在评估大型语言模型(LLMs)认知能力方面的有效性和适用性。

ID: 2503.06551v1来源: arxiv发布时间: 2025-03-11

ARMOR v0.1: Empowering Autoregressive Multimodal Understanding Model with Interleaved Multimodal Generation via Asymmetric Synergy

作者: Jianwen Sun, Yukang Feng, Chuanhao Li, Fanrui Zhang, Zizhen Li, Jiaxin Ai, Sizhuo Zhou, Yu Dai, Shenglin Zhang, Kaipeng Zhang

研究方向: 多模态理解与生成

ARMOR是一种资源高效的纯自回归框架,通过微调现有的多模态大型语言模型(MLLMs)来实现理解和生成能力。它通过改进模型架构、训练数据和训练算法三个方面来提升MLLMs的性能,使其能够生成自然交织的文本-图像。

ID: 2503.06542v1来源: arxiv发布时间: 2025-03-11

AnywhereDoor: Multi-Target Backdoor Attacks on Object Detection

作者: Jialin Lu, Junjie Shan, Ziqi Zhao, Ka-Ho Chow

研究方向: 网络安全,人工智能,计算机视觉

本文研究了一种名为AnywhereDoor的多目标后门攻击方法,用于对象检测模型。该方法允许攻击者在推理时动态地控制目标模型的行为,包括使对象消失、创建新对象或错误标记对象。

ID: 2503.06529v1来源: arxiv发布时间: 2025-03-11

From Motion Signals to Insights: A Unified Framework for Student Behavior Analysis and Feedback in Physical Education Classes

作者: Xian Gao, Jiacheng Ruan, Jingsheng Gao, Mingye Xie, Zongyun Zhang, Ting Liu, Yuzhuo Fu

研究方向: 教育技术,人工智能,运动生理学

提出一种基于运动信号的学生行为分析框架,用于物理教育课程中,通过分析学生的运动信号来优化教学设计和提高教学质量。

ID: 2503.06525v1来源: arxiv发布时间: 2025-03-11

Generative AI as Digital Media

作者: Gilad Abiri

研究方向: 数字媒体平台与生成式AI监管

本文探讨了生成式AI作为数字信息平台的角色,分析了其与社交媒体和搜索引擎的相似之处和不同之处,并探讨了当前AI监管方法在促进生成式AI作为可信赖的中间机构的方面的不足。文章提出了将社交媒体监管策略应用于生成式AI的监管,并比较了欧盟的AI法案和数字服务法案,以突出其在监管生成式AI的媒体方面的重要性。

ID: 2503.06523v1来源: arxiv发布时间: 2025-03-11

Can Small Language Models Reliably Resist Jailbreak Attacks? A Comprehensive Evaluation

作者: Wenhui Zhang, Huiyu Xu, Zhibo Wang, Zeqing He, Ziqi Zhu, Kui Ren

研究方向: 小语言模型(SLM)的安全性和抗篡改能力

本文研究了小语言模型(SLM)在面临篡改攻击时的脆弱性,特别是针对OWASP将“jailbreak攻击”列为大型语言模型(LLM)的主要威胁之一。通过对63个SLM进行大规模实证研究,评估了其对8种先进的jailbreak方法的敏感性,并分析了影响SLM脆弱性的关键因素。

ID: 2503.06519v1来源: arxiv发布时间: 2025-03-11

Towards Superior Quantization Accuracy: A Layer-sensitive Approach

作者: Feng Zhang, Yanbin Liu, Weihua Li, Jie Lv, Xiaodan Wang, Quan Bai

研究方向: 机器学习,量化,大型语言模型

本文提出了一种基于层敏感性的量化方法,通过分析激活敏感性和权重分布的峰度来识别难以准确量化的层,并分配额外的内存预算,从而提高量化精度。

ID: 2503.06518v1来源: arxiv发布时间: 2025-03-11

GFlowVLM: Enhancing Multi-step Reasoning in Vision-Language Models with Generative Flow Networks

作者: Haoqiang Kang, Enna Sachdeva, Piyush Gupta, Sangjae Bae, Kwonjoon Lee

研究方向: 视觉语言模型(VLM)与生成流网络(GFlowNets)在多步推理任务中的应用

本文提出了一种名为GFlowVLM的框架,该框架利用生成流网络对VLM进行微调,以促进复杂推理任务中多样化解决方案的生成。GFlowVLM将环境建模为非马尔可夫决策过程,允许其捕获长期依赖关系,这对于现实世界应用至关重要。该框架使用基于任务的奖励来微调VLM,使其能够超越现有的微调方法,包括监督微调(SFT)和强化学习(RL)方法。

ID: 2503.06514v1来源: arxiv发布时间: 2025-03-12

HFedCKD: Toward Robust Heterogeneous Federated Learning via Data-free Knowledge Distillation and Two-way Contrast

作者: Yiting Zheng, Bohan Lin, Jinqian Chen, Jihua Zhu

研究方向: 联邦学习(Federated Learning)

本文研究了联邦学习在异构数据和环境下的性能问题,特别是针对低参与率导致的性能下降。提出了一种名为HFedCKD的联邦学习框架,通过数据无关的知识蒸馏和双向对比学习来提高模型性能和稳定性。

ID: 2503.06511v1来源: arxiv发布时间: 2025-03-11

LightMotion: A Light and Tuning-free Method for Simulating Camera Motion in Video Generation

作者: Quanjian Song, Zhihang Lin, Zhanpeng Zeng, Ziyue Zhang, Liujuan Cao, Rongrong Ji

研究方向: 视频生成与摄像机运动模拟

该研究提出了一种名为LightMotion的新方法,用于在视频生成中模拟摄像机运动。该方法在潜在空间中操作,无需额外的微调、修复或深度估计,从而比现有方法更加高效。

ID: 2503.06508v2来源: arxiv发布时间: 2025-03-12