Predicting Targeted Therapy Resistance in Non-Small Cell Lung Cancer Using Multimodal Machine Learning

作者: Peiying Hua, Andrea Olofson, Faraz Farhadi, Liesbeth Hondelink, Gregory Tsongalis, Konstantin Dragnev, Dagmar Hoegemann Savellano, Arief Suriawinata, Laura Tafe, Saeed Hassanpour

发布时间: 2025-04-02

来源: arxiv

研究方向: 癌症治疗与预测，机器学习与人工智能在医学领域的应用

主要内容

本研究旨在开发一种多模态机器学习模型，用于预测非小细胞肺癌（NSCLC）患者对靶向治疗的耐药性。该模型结合了病理学图像、基因组学数据和临床变量，以提高预测的准确性和对患者风险分层的能力。

主要贡献

1. 开发了一种基于多模态机器学习的模型，用于预测NSCLC患者的靶向治疗耐药性。

2. 该模型无需手动特征工程，利用常规收集的临床数据。

3. 模型在预测准确性和风险分层方面优于单一模态模型。

4. 通过结合多模态数据，模型提供了对耐药性预测的更全面的视角。

5. 模型在两个不同机构的数据集上均表现出良好的泛化能力。

研究方法

1. 多机构回顾性研究

2. 多模态机器学习模型开发

3. 图像模态：深度学习（卷积神经网络和视觉Transformer）

4. 非图像模态：Cox比例风险回归、自归一化神经网络和多层感知器

5. 融合层：早期融合和晚期融合策略

6. 交叉验证：5折嵌套交叉验证

7. 模型解释：注意力地图、特征重要性系数和细胞组成比较

实验结果

多模态模型在交叉验证中实现了平均c指数为0.82，优于图像和仅非图像模型。Kaplan-Meier分析显示，多模态模型能够将患者分为不同的风险组。RB1突变和西班牙裔种族被确定为关键预测因子。注意力地图突出了具有变形核的区域，细胞分析揭示了高风险患者中炎症细胞减少。

未来工作

在更大、更多样化的队列中进行进一步验证，以实现临床应用。探索更复杂的模型架构，包括端到端训练。研究不同种族和民族背景下的差异，以及如何将这些因素纳入模型。