ExPath: Towards Explaining Targeted Pathways for Biological Knowledge Bases

作者: Rikuto Kotoge, Ziwei Yang, Zheng Chen, Yushun Dong, Yasuko Matsubara, Jimeng Sun, Yasushi Sakurai

发布时间: 2025-02-27

来源: arxiv

研究方向: 生物信息学与机器学习

主要内容

该研究提出了一种名为ExPath的深度学习框架,用于从生物知识库中推断目标路径。该框架通过结合图学习、解释和蛋白质语言模型等技术,实现了从实验数据中推断生物网络中的关键分子相互作用。

主要贡献

1. 提出了一种新的生物网络推断问题,即推断特定数据路径。

2. 开发了一个新的框架ExPath,它由PathMamba和PathExplainer组成,旨在进行路径级建模,并可以直接解释数据。

3. 提出了面向机器学习的生物评估和新的度量标准,证明了推断路径的生物相关性。

4. 收集并构建了机器学习准备好的数据集,并将很快公开发布。

研究方法

1. 大型蛋白质语言模型(pLM)编码和嵌入氨基酸序列(AA-seqs)到图中。

2. PathMamba,一种混合架构,结合了图神经网络(GNNs)和状态空间序列建模(Mamba)来捕获局部交互和全局路径级依赖关系。

3. PathExplainer,一个子图学习模块,通过可训练的路径掩码识别功能关键的节点和边。

4. 面向机器学习的生物评估和新的度量标准。

实验结果

实验结果表明,ExPath推断的路径保持了生物意义。PathMamba在生物网络分类任务中优于所有基线模型。PathExplainer在解释路径方面表现出色,能够有效地解释必要和充分的子图。

未来工作

未来工作将扩展ExPath以分析其他类型的生物网络,使其能够更广泛地应用于系统生物学和医学。