微软 BioEmu-1 推动药物研发:从“单帧画面”到“电影”,AI 精准预测蛋白质结构变化

xxn 阅读:17193 2025-03-01 12:01:55 评论:0

IT之家最新消息指出,微软研究院在2月20日发表博文,宣布推出了一款名为BioEmu-1的AI模型,具备预测蛋白质随时间变化的能力,为生物医学、药物研发和结构生物学领域带来全新的机遇。

AI应用于蛋白质研究

蛋白质在肌肉纤维的形成、疾病抵抗等生物过程中起着关键作用。

科学家利用深度学习在蛋白质结构研究方面取得显著进展,能够根据氨基酸序列精准预测蛋白质结构。不过,仅通过氨基酸序列预测单一蛋白质结构就像是观看电影的快照,只展示了高度灵活分子的一部分。

微软BioEmu-1

BioEmu-1不同于DeepMind的AlphaFold,后者致力于确定静态蛋白质结构,而BioEmu-1则模拟蛋白质在不同构象之间的动态变化,为理解蛋白质运动、设计有效治疗方案提供新工具。

尽管AlphaFold 3在结构生物学领域取得巨大突破,改进了蛋白质与DNA、RNA和小分子的相互作用模型,但无法预测蛋白质随时间的变化。

BioEmu-1填补了这一空白,它能够生成多个可能的构象,而不仅仅是单一的最优结构,这在药物研发中尤为重要。

BioEmu-1应用生成式深度学习,从大型数据集中学习模式,并生成与这些模式一致的新样本,通过结合静态蛋白质结构、分子动力学模拟数据和实验稳定性数据进行训练。

BioEmu-1的核心机制是扩散模型,迭代生成蛋白质结构并根据学到的约束条件提高准确性。其关键输出是平衡系综预测和自由能预测。

BioEmu-1采用三种数据集进行训练:(1)AlphaFold数据库(AFDB)结构;(2)广泛的MD模拟数据集;(3)实验性蛋白质折叠稳定性数据集。

通过这些数据集的训练,BioEmu-1能够识别蛋白质序列映射到多个不同结构,并预测合理的变化结构,学会以正确的概率对折叠和未折叠结构进行采样。

BioEmu-1每小时可生成数千个蛋白质结构样本,相比传统的分子动力学模拟需数周时间,提高了研究速度并降低了计算成本,其自由能预测误差在1 kcal/mol以内,与传统分子动力学模拟相当,但计算成本较低。

IT之家参考链接

广告声明:本文包含外部链接,仅供参考,点击链接查看更多详细信息。

声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

搜索
排行榜
关注我们

扫一扫关注我们,了解最新精彩内容