Lattice Protein Folding with Variational Annealing

作者: Shoummo Ahsan Khandoker, Estelle M. Inack, Mohamed Hibat-Allah

发布时间: 2025-03-03

来源: arxiv

研究方向: 计算生物学,蛋白质折叠,机器学习,变分退火

主要内容

本文研究了蛋白质折叠中的二维水-极(HP)格点模型,提出了一种新的变分退火方法,结合扩展循环神经网络(RNN)和掩码技术,有效地寻找最低能量折叠,并展示了在基准系统中的性能。

主要贡献

1. 提出了一种新的变分退火方法,结合扩展RNN和掩码技术,有效地寻找最低能量折叠。

2. 通过掩码技术,避免了无效折叠的采样,同时保持了RNN的自回归采样特性。

3. 引入了自由能上限训练方案,稳定并提高了RNN在二维HP模型上的训练能力。

4. 该方法可推广到三维空间和其他格点蛋白质折叠模型。

5. 实验结果表明,该方法在基准系统上找到了最优折叠,并与其他机器学习方法进行了比较。

研究方法

1. 扩展循环神经网络(Dilated RNN)

2. 变分退火(Variational Annealing)

3. 掩码技术(Masking)

4. 自由能上限训练方案(Free Energy Upper Bound Training)

实验结果

实验结果表明,该方法在基准系统上找到了最优折叠,并与其他机器学习方法进行了比较。在60个珠子以下的系统中,该方法都能找到最优折叠。与FoldingZero、AlphaGo Zero、DQN-LSTM等方法相比,该方法在能量上具有优势。

未来工作

将该方法推广到三维空间和其他格点蛋白质折叠模型,例如20字母的Miyazawa-Jernigan模型。探索使用编码器网络进行即时推理,以降低推理时间。将该方法应用于更广泛的组合优化问题。