微软 BioEmu-1 推动药物研发：从“单帧画面”到“电影”，AI 精准预测蛋白质结构变化

xxn 阅读：17193 2025-03-01 12:01:55 评论：0

IT之家最新消息指出，微软研究院在2月20日发表博文，宣布推出了一款名为BioEmu-1的AI模型，具备预测蛋白质随时间变化的能力，为生物医学、药物研发和结构生物学领域带来全新的机遇。

蛋白质在肌肉纤维的形成、疾病抵抗等生物过程中起着关键作用。

科学家利用深度学习在蛋白质结构研究方面取得显著进展，能够根据氨基酸序列精准预测蛋白质结构。不过，仅通过氨基酸序列预测单一蛋白质结构就像是观看电影的快照，只展示了高度灵活分子的一部分。

BioEmu-1不同于DeepMind的AlphaFold，后者致力于确定静态蛋白质结构，而BioEmu-1则模拟蛋白质在不同构象之间的动态变化，为理解蛋白质运动、设计有效治疗方案提供新工具。

尽管AlphaFold 3在结构生物学领域取得巨大突破，改进了蛋白质与DNA、RNA和小分子的相互作用模型，但无法预测蛋白质随时间的变化。

BioEmu-1填补了这一空白，它能够生成多个可能的构象，而不仅仅是单一的最优结构，这在药物研发中尤为重要。

BioEmu-1应用生成式深度学习，从大型数据集中学习模式，并生成与这些模式一致的新样本，通过结合静态蛋白质结构、分子动力学模拟数据和实验稳定性数据进行训练。

BioEmu-1的核心机制是扩散模型，迭代生成蛋白质结构并根据学到的约束条件提高准确性。其关键输出是平衡系综预测和自由能预测。

BioEmu-1采用三种数据集进行训练：(1)AlphaFold数据库(AFDB)结构；(2)广泛的MD模拟数据集；(3)实验性蛋白质折叠稳定性数据集。

通过这些数据集的训练，BioEmu-1能够识别蛋白质序列映射到多个不同结构，并预测合理的变化结构，学会以正确的概率对折叠和未折叠结构进行采样。

BioEmu-1每小时可生成数千个蛋白质结构样本，相比传统的分子动力学模拟需数周时间，提高了研究速度并降低了计算成本，其自由能预测误差在1 kcal/mol以内，与传统分子动力学模拟相当，但计算成本较低。

IT之家参考链接

广告声明：本文包含外部链接，仅供参考，点击链接查看更多详细信息。

声明

1.本站遵循行业规范，任何转载的稿件都会明确标注作者和来源；2.本站的原创文章，请转载时务必注明文章作者和来源，不尊重原创的行为我们将追究责任；3.作者投稿可能会经我们编辑修改或补充。