Citrus: Leveraging Expert Cognitive Pathways in a Medical Language Model for Advanced Medical Decision Support

作者: Guoxin Wang, Minyu Gao, Shuai Yang, Ya Zhang, Lizhi He, Liang Huang, Hanlin Xiao, Yexuan Zhang, Wanyue Li, Lu Chen, Jintao Fei, Xin Li

研究方向: 医学语言模型与医疗决策支持

本文介绍了一种名为Citrus的医学语言模型,该模型通过模拟医疗专家的认知过程来提升医疗推理能力。模型基于模拟的专家疾病推理数据集进行训练,并通过多种训练方法,如连续预训练(CPT)、监督微调(SFT)和强化学习(RL),来提升其性能。

ID: 2502.18274v1来源: arxiv发布时间: 2025-02-27

UASTrack: A Unified Adaptive Selection Framework with Modality-Customization in Single Object Tracking

作者: He Wang, Tianyang Xu, Zhangyong Tang, Xiao-Jun Wu, Josef Kittler

研究方向: 多模态目标跟踪,特别是单目标跟踪(SOT)

本文提出了一种名为UASTrack的统一自适应选择框架,该框架在单目标跟踪中实现了模态自适应感知和模态定制。UASTrack通过使用一个判别性自动选择器(DAS)和任务定制优化适配器(TCOA)来动态识别输入模态类型,并根据不同的模态定制网络结构,以实现对不同模态的有效利用。

ID: 2502.18220v1来源: arxiv发布时间: 2025-02-27

FLARE: A Framework for Stellar Flare Forecasting using Stellar Physical Properties and Historical Records

作者: Bingke Zhu, Xiaoxiao Wang, Minghui Jia, Yihan Tao, Xiao Kong, Ali Luo, Yingying Chen, Ming Tang, Jinqiao Wang

研究方向: 天文研究,特别是恒星耀斑预测

FLARE模型旨在通过结合恒星物理属性和历史上的耀斑记录来预测恒星耀斑事件。该模型使用深度学习技术,特别是预训练的大型语言模型(PLM)和光曲线数据分析,以提高预测的准确性。

ID: 2502.18218v1来源: arxiv发布时间: 2025-02-27

LAG: LLM agents for Leaderboard Auto Generation on Demanding

作者: Jian Wu, Jiayu Zhang, Dongyuan Li, Linyi Yang, Aoxiao Zhong, Renhe Jiang, Qingsong Wen, Yue Zhang

研究方向: 人工智能领域中的 leaderboard 自动生成

本文提出了一种名为 LAG 的框架,用于自动生成特定研究主题的 leaderboard。该框架利用大型语言模型(LLM)来收集论文、提取实验结果、生成和评估 leaderboard。通过这种方式,LAG 可以快速、高效地创建包含最新和高质量基准的 leaderboard。

ID: 2502.18209v1来源: arxiv发布时间: 2025-02-27

DenoMAE2.0: Improving Denoising Masked Autoencoders by Classifying Local Patches

作者: Atik Faysal, Mohammad Rostami, Taha Boushine, Reihaneh Gh. Roshan, Huaxia Wang, Nikhil Muralidhar

研究方向: 无线通信中的自动调制分类(AMC)和半监督学习

提出了一种名为DenoMAE2.0的增强去噪掩码自动编码器,通过结合去噪重建和局部图像块分类目标,提高了表示学习和鲁棒性。DenoMAE2.0通过引入位置感知的局部图像块分类,使模型能够在保持全局一致性的同时捕获细粒度局部特征。

ID: 2502.18202v1来源: arxiv发布时间: 2025-02-27

VesselSAM: Leveraging SAM for Aortic Vessel Segmentation with LoRA and Atrous Attention

作者: Adnan Iltaf, Rayan Merghani Ahmed, Bin Li, Shoujun Zhou

研究方向: 医学图像分割、计算机视觉、深度学习

本文提出了一种名为VesselSAM的医学图像分割模型,旨在提高主动脉血管分割的准确性。该模型基于Segment Anything Model (SAM)架构,并引入了AtrousLoRA模块,结合Atrous Attention和Low-Rank Adaptation (LoRA)技术,以提升分割性能和降低计算成本。

ID: 2502.18185v1来源: arxiv发布时间: 2025-02-27

ChatMotion: A Multimodal Multi-Agent for Human Motion Analysis

作者: Li Lei, Jia Sen, Wang Jianhao, An Zhaochong, Li Jiaang, Hwang Jenq-Neng, Belongie Serge

研究方向: 人机交互与运动理解

本文介绍了ChatMotion,这是一个基于多模态多智能体框架的人体运动分析方法。ChatMotion能够动态解释用户意图,将复杂任务分解成元任务,并激活专门的功能模块来理解运动。它集成了多个专门模块,如MotionCore,从不同角度分析人体运动。

ID: 2502.18180v1来源: arxiv发布时间: 2025-02-27

Problem Solved? Information Extraction Design Space for Layout-Rich Documents using LLMs

作者: Gaye Colakoglu, Gürkan Solmaz, Jonathan Fürst

研究方向: 信息提取与自然语言处理

本文探讨了使用大型语言模型(LLMs)从布局丰富的文档中提取信息的设计空间。研究重点关注数据结构、模型参与和输出细化三个核心挑战,并通过实验评估了不同设计选择的效果。

ID: 2502.18179v1来源: arxiv发布时间: 2025-02-27

CLIPure: Purification in Latent Space via CLIP for Adversarially Robust Zero-Shot Classification

作者: Mingkun Zhang, Keping Bi, Wei Chen, Jiafeng Guo, Xueqi Cheng

研究方向: 计算机视觉,机器学习,对抗样本防御

本文提出了一种名为CLIPure的对抗鲁棒零样本图像分类器,它基于CLIP模型,通过在CLIP的潜在空间中进行净化来提高对抗鲁棒性。

ID: 2502.18176v1来源: arxiv发布时间: 2025-02-27

SECURA: Sigmoid-Enhanced CUR Decomposition with Uninterrupted Retention and Low-Rank Adaptation in Large Language Models

作者: Yuxuan Zhang

研究方向: 自然语言处理,机器学习,持续学习

该研究提出了一种名为SECURA的参数高效微调方法,旨在解决大型语言模型在微调过程中遇到的灾难性遗忘问题,同时提高微调性能。

ID: 2502.18168v2来源: arxiv发布时间: 2025-02-27