Daily Papers

Synthesizing Tabular Data Using Selectivity Enhanced Generative Adversarial Networks

作者: Youran Zhou, Jianzhong Qi

研究方向: 数据合成与隐私保护

该研究针对电子商务平台在处理大量交易数据时面临的挑战，提出了一种基于生成对抗网络（GAN）的表格数据合成方法，以解决数据短缺、隐私保护和机器学习实用性问题。该方法通过引入查询选择性约束，提高了合成数据的真实性和准确性。

ID: 2502.21034v1•来源: arxiv•发布时间: 2025-03-03

Beyond Words: A Latent Memory Approach to Internal Reasoning in LLMs

作者: José I. Orlicki

研究方向: 大型语言模型（LLMs）内部推理与认知神经科学

本文提出了一种将隐式心理表征集成到LLMs内部推理过程中的框架。该框架包含一个隐式记忆模块（IMM），用于动态存储和检索潜在表示，以提高推理效率。

ID: 2502.21030v1•来源: arxiv•发布时间: 2025-03-03

Measuring and identifying factors of individuals' trust in Large Language Models

作者: Edoardo Sebastiano De Duro, Giuseppe Alessandro Veltri, Hudson Golino, Massimo Stella

研究方向: 人工智能与心理学交叉领域

本研究旨在通过开发一个名为 Trust-In-LLMs Index (TILLMI) 的心理测量工具，来测量个体对大型语言模型 (LLMs) 的信任程度。该工具基于 McAllister 的信任认知和情感维度，并将其扩展到 LLM 与人类交互的情境中。

ID: 2502.21028v1•来源: arxiv•发布时间: 2025-03-03

Merging Clinical Knowledge into Large Language Models for Medical Research and Applications: A Survey

作者: Qiyuan Li, Haijiang Liu, Caicai Guo, Deyu Chen, Meng Wang, Feng Gao, Jinguang Gu

研究方向: 医学领域中的大型语言模型（Medical LLM）构建与应用

该论文对医学领域中的大型语言模型（Medical LLM）进行了全面的综述，涵盖了从数据收集、模型构建、评估方法到实际应用等多个方面。论文主要关注如何将临床知识融入LLM，以提高其在医学研究和实际应用中的性能。

ID: 2502.20988v1•来源: arxiv•发布时间: 2025-03-03

LesionLocator: Zero-Shot Universal Tumor Segmentation and Tracking in 3D Whole-Body Imaging

作者: Maximilian Rokuss, Yannick Kirchhoff, Seval Akbal, Balint Kovacs, Saikat Roy, Constantin Ulrich, Tassilo Wald, Lukas T. Rotkopf, Heinz-Peter Schlemmer, Klaus Maier-Hein

研究方向: 医学图像处理，特别是肿瘤的自动分割和追踪

LesionLocator是一个用于3D全身医学图像中肿瘤的零样本分割和追踪的框架。它能够对多种类型的肿瘤进行分割和追踪，并具有在时间维度上进行追踪的能力。

ID: 2502.20985v1•来源: arxiv•发布时间: 2025-03-03

UoR-NCL at SemEval-2025 Task 1: Using Generative LLMs and CLIP Models for Multilingual Multimodal Idiomaticity Representation

作者: Thanet Markchom, Tong Wu, Liting Huang, Huizhi Liang

研究方向: 自然语言处理（NLP）和计算机视觉（CV）的多模态融合，以及成语的语义表示和图像排序

本文针对SemEval-2025 Task 1任务，提出了一种使用生成式大型语言模型（LLM）和多语言CLIP模型来增强成语表示的方法，以实现基于成语的图像排序。

ID: 2502.20984v1•来源: arxiv•发布时间: 2025-03-03

Improving Open-world Continual Learning under the Constraints of Scarce Labeled Data

作者: Yujie Li, Xiangkun Wang, Xin Yang, Marcello Bonsangue, Junbo Zhang, Tianrui Li

研究方向: 开放世界持续学习（OWCL）与稀缺标签数据下的持续学习（OFCL）

本文针对稀缺标签数据下的开放世界持续学习问题，提出了一种名为OFCL的新框架，旨在解决开放检测和知识迁移的挑战。该框架通过三个关键组件实现：实例级token增强（ITA）、基于边界的开放边界（MOB）和自适应知识空间（AKS）。

ID: 2502.20974v1•来源: arxiv•发布时间: 2025-03-03

Retrieval Augmented Generation for Topic Modeling in Organizational Research: An Introduction with Empirical Demonstration

作者: Gerion Spielberger, Florian Artinger, Jochen Reb, Rudolf Kerschreiter

研究方向: 组织研究中的文本数据分析与主题建模

本文提出了一种名为Agentic RAG的文本数据分析方法，用于组织研究中的主题建模。该方法结合了检索、生成和代理驱动的学习三个关键组件，以提高主题建模的效率、透明度、有效性和可靠性。

ID: 2502.20963v1•来源: arxiv•发布时间: 2025-03-03

Concealed Adversarial attacks on neural networks for sequential data

作者: Petr Sokerin, Dmitry Anikin, Sofia Krehova, Alexey Zaytsev

研究方向: 时间序列数据与深度学习

该研究针对时间序列数据中的神经网络模型，提出了一种隐蔽对抗攻击方法。该方法旨在生成难以被人类或模型检测到的对抗样本，从而提高时间序列模型的鲁棒性。

ID: 2502.20948v1•来源: arxiv•发布时间: 2025-03-03

Generative Uncertainty in Diffusion Models

作者: Metod Jazbec, Eliot Wong-Toi, Guoxuan Xia, Dan Zhang, Eric Nalisnick, Stephan Mandt

研究方向: 生成模型与不确定性量化

该论文提出了一种基于贝叶斯推理的生成不确定性估计方法，用于检测生成模型（如扩散模型）中生成的低质量样本。该方法通过在潜在空间中引入语义似然，有效地解决了高维样本空间带来的挑战，并通过实验证明了其在识别低质量样本方面的有效性。

ID: 2502.20946v1•来源: arxiv•发布时间: 2025-03-03