Pre-training with 3D Synthetic Data: Learning 3D Point Cloud Instance Segmentation from 3D Synthetic Scenes

作者: Daichi Otsuka, Shinichi Mae, Ryosuke Yamada, Hirokatsu Kataoka

研究方向: 三维点云实例分割与生成模型

该研究提出了一种基于生成模型(Point-E)的3D点云实例分割模型预训练方法,通过使用3D合成数据来扩展3D场景数据集,并在此基础上进行模型训练,以提高3D点云实例分割的准确性。

ID: 2503.24229v1来源: arxiv发布时间: 2025-04-03

PAARS: Persona Aligned Agentic Retail Shoppers

作者: Saab Mansour, Leonardo Perelli, Lorenzo Mainetti, George Davidson, Stefano D'Amato

研究方向: 电子商务领域的人机行为模拟与数据分析

该研究提出了PAARS框架,通过利用LLM驱动的代理来模拟人类购物行为,并通过个体和群体层面的对齐套件确保其可靠性。该框架通过从匿名历史购物数据中自动挖掘角色,为代理配备零售特定工具来模拟购物会话,并引入了一个新颖的对齐套件来衡量人类和购物代理在群体(即人口)层面的分布差异。

ID: 2503.24228v1来源: arxiv发布时间: 2025-04-02

BAR-Analytics: A Web-based Platform for Analyzing Information Spreading Barriers in News: Comparative Analysis Across Multiple Barriers and Events

作者: Abdul Sittar, Dunja Mladenic, Alenka Gucek, Marko Grobelnik

研究方向: 新闻传播分析,信息传播障碍研究

本文介绍了BAR-Analytics,一个基于Web的开源平台,用于分析新闻在地理、经济、政治和文化边界上的传播。该平台结合了多种分析方法,包括传播分析、趋势分析、分层主题建模和情感分析,以揭示不同冲突中新闻报道的差异。

ID: 2503.24220v1来源: arxiv发布时间: 2025-04-03

MB-ORES: A Multi-Branch Object Reasoner for Visual Grounding in Remote Sensing

作者: Karim Radouane, Hanane Azzag, Mustapha lebbah

研究方向: 计算机视觉与自然语言处理交叉领域,专注于遥感图像的视觉定位和指代表达理解(REC)。

提出了一种名为MB-ORES的多分支对象推理器,用于遥感图像的视觉定位。该框架结合了目标检测(OD)和视觉定位(VG),通过细调一个开放集目标检测器,并利用指代表达数据进行部分监督学习,以支持传统的OD并建立VG任务的直观先验。

ID: 2503.24219v1来源: arxiv发布时间: 2025-04-02

All You Need is Sally-Anne: ToM in AI Strongly Supported After Surpassing Tests for 3-Year-Olds

作者: Nitay Alon, Joseph Barnby, Reuth Mirsky, Stefan Sarkadi

研究方向: 人工智能与认知科学中的理论思维(ToM)研究

本文研究了人工智能(AI)中的理论思维(ToM)能力,提出了一种名为ToM and GeRRI的模型,该模型在Sally-Anne测试和Smarties任务中表现优异,超越了3岁儿童的测试标准。

ID: 2503.24215v1来源: arxiv发布时间: 2025-04-02

DiET-GS: Diffusion Prior and Event Stream-Assisted Motion Deblurring 3D Gaussian Splatting

作者: Seungjun Lee, Gim Hee Lee

研究方向: 计算机视觉与图像处理

该研究提出了一种名为DiET-GS的框架,用于从模糊的多视图图像中重建清晰的3D场景。该方法结合了基于事件的相机和扩散模型,以有效地去除运动模糊并恢复细节和颜色。

ID: 2503.24210v1来源: arxiv发布时间: 2025-04-02

Synthetic News Generation for Fake News Classification

作者: Abdul Sittar, Luka Golob, Mateja Smiljanic

研究方向: 合成新闻生成与假新闻分类

本研究探索了通过基于事实的操纵使用大型语言模型(LLM)生成和评估合成假新闻。提出了一种新方法,从真实文章中提取关键事实,修改它们,并重新生成内容以模拟假新闻,同时保持连贯性。为了评估生成内容的质量,提出了一组评估指标——连贯性、差异性和正确性。研究还调查了合成数据在假新闻分类中的应用,比较了传统的机器学习模型和基于transformer的模型(如BERT)。实验表明,transformer模型,特别是BERT,有效地利用合成数据进行假新闻检测,显示出使用较小比例合成数据的改进。此外,研究发现,事实验证功能,专注于识别事实不一致性,在区分合成假新闻方面提供了最有希望的结果。

ID: 2503.24206v1来源: arxiv发布时间: 2025-04-03

Agent-Based Simulations of Online Political Discussions: A Case Study on Elections in Germany

作者: Abdul Sittar, Simon Münker, Fabio Sartori, Andreas Reitenbach, Achim Rettinger, Michael Mäs, Alenka Guček, Marko Grobelnik

研究方向: 社交媒体中的用户互动与政治讨论模拟

本研究通过构建一个基于代理的模拟模型,模拟德国Twitter平台上政治讨论的用户互动,并分析历史语境、资源限制和奖励机制对用户参与度和AI生成回应的影响。

ID: 2503.24199v1来源: arxiv发布时间: 2025-04-02

TwT: Thinking without Tokens by Habitual Reasoning Distillation with Multi-Teachers' Guidance

作者: Jingxian Xu, Mengyu Zhou, Weichang Liu, Hanbing Liu, Shi Han, Dongmei Zhang

研究方向: 自然语言处理(NLP)和大型语言模型(LLM)推理优化

提出了一种名为TwT(Thinking without Tokens)的方法,通过结合习惯推理蒸馏和多教师指导,在保持高性能的同时,降低LLM推理的计算成本。

ID: 2503.24198v1来源: arxiv发布时间: 2025-04-03

Output Constraints as Attack Surface: Exploiting Structured Generation to Bypass LLM Safety Mechanisms

作者: Shuoming Zhang, Jiacheng Zhao, Ruiyuan Xu, Xiaobing Feng, Huimin Cui

研究方向: 大型语言模型(LLM)安全

该研究主要关注LLM的安全问题,特别是针对LLM中约束解码技术的潜在安全漏洞。研究者们揭示了通过结构化生成来绕过LLM安全机制的新攻击方法,并提出了相应的防御策略。

ID: 2503.24191v1来源: arxiv发布时间: 2025-04-02