Citrus: Leveraging Expert Cognitive Pathways in a Medical Language Model for Advanced Medical Decision Support
作者: Guoxin Wang, Minyu Gao, Shuai Yang, Ya Zhang, Lizhi He, Liang Huang, Hanlin Xiao, Yexuan Zhang, Wanyue Li, Lu Chen, Jintao Fei, Xin Li
发布时间: 2025-02-27
来源: arxiv
研究方向: 医学语言模型与医疗决策支持
主要内容
本文介绍了一种名为Citrus的医学语言模型,该模型通过模拟医疗专家的认知过程来提升医疗推理能力。模型基于模拟的专家疾病推理数据集进行训练,并通过多种训练方法,如连续预训练(CPT)、监督微调(SFT)和强化学习(RL),来提升其性能。
主要贡献
1. 提出了一种无需训练的推理方法,该方法模拟了医疗专家的认知过程,使大型语言模型在临床诊断和治疗方面提升了医疗能力。
2. 结合数据构建方法,引入了一种多阶段后训练方法,进一步提高了模型的医疗性能。
3. 将Citrus模型及其训练数据作为开源资源公开,以促进AI驱动医疗决策研究。
4. 开发并开源了一个基于真实数据的可更新临床实践评估数据集,准确反映了现实世界中患者的分布。
研究方法
1. 模拟专家疾病推理数据集的构建
2. 连续预训练(CPT)
3. 监督微调(SFT)
4. 强化学习(RL)
5. 双专家推理方法
6. 基于真实世界数据的临床实践评估数据集构建
实验结果
在多个权威医疗基准测试中,Citrus的性能优于其他类似规模的模型,这突显了其在医疗决策支持系统中的潜力。
未来工作
未来的工作将集中于进一步优化模型性能,使其在更广泛的医疗任务中发挥作用,并确保其在临床实践中的应用安全有效。