Predicting Targeted Therapy Resistance in Non-Small Cell Lung Cancer Using Multimodal Machine Learning
作者: Peiying Hua, Andrea Olofson, Faraz Farhadi, Liesbeth Hondelink, Gregory Tsongalis, Konstantin Dragnev, Dagmar Hoegemann Savellano, Arief Suriawinata, Laura Tafe, Saeed Hassanpour
发布时间: 2025-04-02
来源: arxiv
研究方向: 癌症治疗与预测,机器学习与人工智能在医学领域的应用
主要内容
本研究旨在开发一种多模态机器学习模型,用于预测非小细胞肺癌(NSCLC)患者对靶向治疗的耐药性。该模型结合了病理学图像、基因组学数据和临床变量,以提高预测的准确性和对患者风险分层的能力。
主要贡献
1. 开发了一种基于多模态机器学习的模型,用于预测NSCLC患者的靶向治疗耐药性。
2. 该模型无需手动特征工程,利用常规收集的临床数据。
3. 模型在预测准确性和风险分层方面优于单一模态模型。
4. 通过结合多模态数据,模型提供了对耐药性预测的更全面的视角。
5. 模型在两个不同机构的数据集上均表现出良好的泛化能力。
研究方法
1. 多机构回顾性研究
2. 多模态机器学习模型开发
3. 图像模态:深度学习(卷积神经网络和视觉Transformer)
4. 非图像模态:Cox比例风险回归、自归一化神经网络和多层感知器
5. 融合层:早期融合和晚期融合策略
6. 交叉验证:5折嵌套交叉验证
7. 模型解释:注意力地图、特征重要性系数和细胞组成比较
实验结果
多模态模型在交叉验证中实现了平均c指数为0.82,优于图像和仅非图像模型。Kaplan-Meier分析显示,多模态模型能够将患者分为不同的风险组。RB1突变和西班牙裔种族被确定为关键预测因子。注意力地图突出了具有变形核的区域,细胞分析揭示了高风险患者中炎症细胞减少。
未来工作
在更大、更多样化的队列中进行进一步验证,以实现临床应用。探索更复杂的模型架构,包括端到端训练。研究不同种族和民族背景下的差异,以及如何将这些因素纳入模型。