Deep Causal Behavioral Policy Learning: Applications to Healthcare

作者: Jonas Knecht, Anna Zink, Jonathan Kolstad, Maya Petersen

发布时间: 2025-03-07

来源: arxiv

研究方向: 医疗保健领域的深度因果行为政策学习

主要内容

该研究提出了一种基于深度学习的医疗保健领域行为政策学习方法,旨在通过分析临床行为路径,识别因果关系,并优化患者治疗方案。

主要贡献

1. 提出了一种名为深度因果行为政策学习(DC-BPL)的方法,用于分析医疗保健中的动态临床行为制度。

2. 使用深度学习算法学习高维临床行动路径的分布,并识别这些路径与患者结果之间的因果关系。

3. 开发了一种大型临床行为模型(LCBM),用于在电子健康记录数据上训练,并使用变压器架构来估计临床行为策略。

4. 提出了一种新的对行为策略的解释,即它是对治疗患者所使用的复杂、通常隐含的知识的高效编码。

5. 该方法支持多种临床应用,包括因果严格的质量测量、提供者指导、基于因果的临床决策支持以及调整临床推理模型等工具。

研究方法

1. 深度学习算法

2. 变压器架构

3. 半参数有效估计因果效应的方法

4. 机器学习方法,用于最佳制度和策略学习

5. 结构因果模型(SCM)

6. 因果推断

7. 统计经济学和计算机科学文献中的方法

实验结果

通过对来自UCSF急诊部门的真实世界EHR数据的初步分析,证明了LCBM的能力,能够估计临床行为策略。实验结果表明,随着上下文长度的增加,模型的准确性显著提高。此外,通过条件化模型的不确定性,可以提高预测准确性。

未来工作

未来工作将包括在更大的临床数据库上训练LCBM,包括复杂的患者状态空间,以及使用更复杂的架构。此外,还将开发新的评估方法,特别是针对安全部署的方法。此外,还将探索将多模态数据(如图像和文本)纳入临床行为策略的估计中。