Chemical knowledge-informed framework for privacy-aware retrosynthesis learning

作者: Guikun Chen, Xu Zhang, Yi Yang, Wenguan Wang

发布时间: 2025-02-27

来源: arxiv

研究方向: 化学知识驱动的隐私保护反合成学习

主要内容

本文研究了在化学知识指导下,如何通过隐私保护的方式学习反合成模型。针对传统机器学习反合成训练模式存在的隐私风险,提出了一种名为CKIF的化学知识驱动的框架,实现多个化学组织之间的分布式训练,同时保护私有反应数据的机密性。

主要贡献

1. 提出了一种名为CKIF的化学知识驱动的框架,通过化学知识指导模型聚合,提高反合成预测的准确性。

2. CKIF在多个反应数据集上优于现有的基线方法,如FedAvg,证明了其在隐私保护反合成学习中的可行性和优越性。

3. CKIF能够处理数据异构性问题,通过化学知识信息加权策略,为每个化学实体训练个性化模型。

4. CKIF具有可扩展性,随着参与者的增加,性能进一步提升。

研究方法

1. 分布式机器学习

2. 化学知识信息加权策略

3. 分子指纹

4. MACCS keys

5. Transformer模型

实验结果

CKIF在多个反应数据集上优于现有的基线方法,如Locally Trained、Centrally Trained和FedAvg。实验结果表明,CKIF在提高反合成预测准确性方面具有显著优势,同时保证了数据隐私。

未来工作

未来工作将探索以下方面:1)针对不同化学实体的个性化分子指纹或测量方法;2)评估合成路线的实用性和可行性;3)研究隐私泄漏和数据中毒的防御机制。