Expertise Is What We Want

作者: Alan Ashworth, Munir Al-Dajani, Keegan Duchicela, Kiril Kafadarov, Allison Kurian, Othman Laraki, Amina Lazrak, Divneet Mandair, Wendy McKennon, Rebecca Miksad, Jayodita Sanghvi, Travis Zack

发布时间: 2025-02-28

来源: arxiv

研究方向: 医学人工智能,临床决策支持系统

主要内容

本文提出了一种名为Large Language Expert (LLE)的混合架构,旨在解决临床决策支持系统中将标准化、基于证据的指南转化为自动化系统时可能出现的准确性下降和细微差别丢失的问题。该架构结合了大型语言模型(LLM)的灵活性和强大功能,以及专家系统的可解释性、可说明性和可靠性。

主要贡献

1. 提出了一种新的混合架构LLE,结合了LLM和专家系统的优势。

2. 开发了Cancer Copilot工具,用于辅助癌症患者的诊断工作。

3. 通过实验验证了LLE架构在识别癌症患者诊断工作漏洞方面的有效性。

4. 展示了LLE架构在减少工作量和提高临床质量方面的潜力。

研究方法

1. 混合架构设计:结合LLM和专家系统的优势。

2. 知识库开发:将临床指南转化为LLM优化的声明性格式。

3. 知识库服务器:支持版本控制和命名空间。

4. 临床决策因素提取:使用LLM从患者记录中提取关键信息。

5. 潜在推荐评估:使用逻辑评估器确定相关的工作。

6. 专家审查:确保系统输出的准确性和可靠性。

实验结果

在乳腺癌和结直肠癌患者的研究中,Cancer Copilot在提取临床决策因素和推荐工作方面表现出高准确率(>95%)。医生对系统的调整率低于5%,表明LLE架构在将复杂临床逻辑应用于实际患者数据方面的有效性。

未来工作

进一步改进LLE架构,提高其准确性和可靠性。探索LLE架构在更多医疗领域的应用,如临床试验匹配、急诊科分诊、保险预授权等。开发一个由专业学会发布的知识库生态系统,由个别机构适应和验证,并通过专门的临床应用程序提供。