Synthesizing Tabular Data Using Selectivity Enhanced Generative Adversarial Networks

作者: Youran Zhou, Jianzhong Qi

研究方向: 数据合成与隐私保护

该研究针对电子商务平台在处理大量交易数据时面临的挑战,提出了一种基于生成对抗网络(GAN)的表格数据合成方法,以解决数据短缺、隐私保护和机器学习实用性问题。该方法通过引入查询选择性约束,提高了合成数据的真实性和准确性。

ID: 2502.21034v1来源: arxiv发布时间: 2025-03-03

Beyond Words: A Latent Memory Approach to Internal Reasoning in LLMs

作者: José I. Orlicki

研究方向: 大型语言模型(LLMs)内部推理与认知神经科学

本文提出了一种将隐式心理表征集成到LLMs内部推理过程中的框架。该框架包含一个隐式记忆模块(IMM),用于动态存储和检索潜在表示,以提高推理效率。

ID: 2502.21030v1来源: arxiv发布时间: 2025-03-03

Measuring and identifying factors of individuals' trust in Large Language Models

作者: Edoardo Sebastiano De Duro, Giuseppe Alessandro Veltri, Hudson Golino, Massimo Stella

研究方向: 人工智能与心理学交叉领域

本研究旨在通过开发一个名为 Trust-In-LLMs Index (TILLMI) 的心理测量工具,来测量个体对大型语言模型 (LLMs) 的信任程度。该工具基于 McAllister 的信任认知和情感维度,并将其扩展到 LLM 与人类交互的情境中。

ID: 2502.21028v1来源: arxiv发布时间: 2025-03-03

Merging Clinical Knowledge into Large Language Models for Medical Research and Applications: A Survey

作者: Qiyuan Li, Haijiang Liu, Caicai Guo, Deyu Chen, Meng Wang, Feng Gao, Jinguang Gu

研究方向: 医学领域中的大型语言模型(Medical LLM)构建与应用

该论文对医学领域中的大型语言模型(Medical LLM)进行了全面的综述,涵盖了从数据收集、模型构建、评估方法到实际应用等多个方面。论文主要关注如何将临床知识融入LLM,以提高其在医学研究和实际应用中的性能。

ID: 2502.20988v1来源: arxiv发布时间: 2025-03-03

LesionLocator: Zero-Shot Universal Tumor Segmentation and Tracking in 3D Whole-Body Imaging

作者: Maximilian Rokuss, Yannick Kirchhoff, Seval Akbal, Balint Kovacs, Saikat Roy, Constantin Ulrich, Tassilo Wald, Lukas T. Rotkopf, Heinz-Peter Schlemmer, Klaus Maier-Hein

研究方向: 医学图像处理,特别是肿瘤的自动分割和追踪

LesionLocator是一个用于3D全身医学图像中肿瘤的零样本分割和追踪的框架。它能够对多种类型的肿瘤进行分割和追踪,并具有在时间维度上进行追踪的能力。

ID: 2502.20985v1来源: arxiv发布时间: 2025-03-03

UoR-NCL at SemEval-2025 Task 1: Using Generative LLMs and CLIP Models for Multilingual Multimodal Idiomaticity Representation

作者: Thanet Markchom, Tong Wu, Liting Huang, Huizhi Liang

研究方向: 自然语言处理(NLP)和计算机视觉(CV)的多模态融合,以及成语的语义表示和图像排序

本文针对SemEval-2025 Task 1任务,提出了一种使用生成式大型语言模型(LLM)和多语言CLIP模型来增强成语表示的方法,以实现基于成语的图像排序。

ID: 2502.20984v1来源: arxiv发布时间: 2025-03-03

Improving Open-world Continual Learning under the Constraints of Scarce Labeled Data

作者: Yujie Li, Xiangkun Wang, Xin Yang, Marcello Bonsangue, Junbo Zhang, Tianrui Li

研究方向: 开放世界持续学习(OWCL)与稀缺标签数据下的持续学习(OFCL)

本文针对稀缺标签数据下的开放世界持续学习问题,提出了一种名为OFCL的新框架,旨在解决开放检测和知识迁移的挑战。该框架通过三个关键组件实现:实例级token增强(ITA)、基于边界的开放边界(MOB)和自适应知识空间(AKS)。

ID: 2502.20974v1来源: arxiv发布时间: 2025-03-03

Retrieval Augmented Generation for Topic Modeling in Organizational Research: An Introduction with Empirical Demonstration

作者: Gerion Spielberger, Florian Artinger, Jochen Reb, Rudolf Kerschreiter

研究方向: 组织研究中的文本数据分析与主题建模

本文提出了一种名为Agentic RAG的文本数据分析方法,用于组织研究中的主题建模。该方法结合了检索、生成和代理驱动的学习三个关键组件,以提高主题建模的效率、透明度、有效性和可靠性。

ID: 2502.20963v1来源: arxiv发布时间: 2025-03-03

Concealed Adversarial attacks on neural networks for sequential data

作者: Petr Sokerin, Dmitry Anikin, Sofia Krehova, Alexey Zaytsev

研究方向: 时间序列数据与深度学习

该研究针对时间序列数据中的神经网络模型,提出了一种隐蔽对抗攻击方法。该方法旨在生成难以被人类或模型检测到的对抗样本,从而提高时间序列模型的鲁棒性。

ID: 2502.20948v1来源: arxiv发布时间: 2025-03-03

Generative Uncertainty in Diffusion Models

作者: Metod Jazbec, Eliot Wong-Toi, Guoxuan Xia, Dan Zhang, Eric Nalisnick, Stephan Mandt

研究方向: 生成模型与不确定性量化

该论文提出了一种基于贝叶斯推理的生成不确定性估计方法,用于检测生成模型(如扩散模型)中生成的低质量样本。该方法通过在潜在空间中引入语义似然,有效地解决了高维样本空间带来的挑战,并通过实验证明了其在识别低质量样本方面的有效性。

ID: 2502.20946v1来源: arxiv发布时间: 2025-03-03