微软 BioEmu-1 推动药物研发:从“单帧画面”到“电影”,AI 精准预测蛋白质结构变化
IT之家最新消息指出,微软研究院在2月20日发表博文,宣布推出了一款名为BioEmu-1的AI模型,具备预测蛋白质随时间变化的能力,为生物医学、药物研发和结构生物学领域带来全新的机遇。
AI应用于蛋白质研究
蛋白质在肌肉纤维的形成、疾病抵抗等生物过程中起着关键作用。
科学家利用深度学习在蛋白质结构研究方面取得显著进展,能够根据氨基酸序列精准预测蛋白质结构。不过,仅通过氨基酸序列预测单一蛋白质结构就像是观看电影的快照,只展示了高度灵活分子的一部分。
微软BioEmu-1
BioEmu-1不同于DeepMind的AlphaFold,后者致力于确定静态蛋白质结构,而BioEmu-1则模拟蛋白质在不同构象之间的动态变化,为理解蛋白质运动、设计有效治疗方案提供新工具。
尽管AlphaFold 3在结构生物学领域取得巨大突破,改进了蛋白质与DNA、RNA和小分子的相互作用模型,但无法预测蛋白质随时间的变化。
BioEmu-1填补了这一空白,它能够生成多个可能的构象,而不仅仅是单一的最优结构,这在药物研发中尤为重要。
BioEmu-1应用生成式深度学习,从大型数据集中学习模式,并生成与这些模式一致的新样本,通过结合静态蛋白质结构、分子动力学模拟数据和实验稳定性数据进行训练。
BioEmu-1的核心机制是扩散模型,迭代生成蛋白质结构并根据学到的约束条件提高准确性。其关键输出是平衡系综预测和自由能预测。
BioEmu-1采用三种数据集进行训练:(1)AlphaFold数据库(AFDB)结构;(2)广泛的MD模拟数据集;(3)实验性蛋白质折叠稳定性数据集。
通过这些数据集的训练,BioEmu-1能够识别蛋白质序列映射到多个不同结构,并预测合理的变化结构,学会以正确的概率对折叠和未折叠结构进行采样。
BioEmu-1每小时可生成数千个蛋白质结构样本,相比传统的分子动力学模拟需数周时间,提高了研究速度并降低了计算成本,其自由能预测误差在1 kcal/mol以内,与传统分子动力学模拟相当,但计算成本较低。
IT之家参考链接
广告声明:本文包含外部链接,仅供参考,点击链接查看更多详细信息。
1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。