Nature | 使用AlphaFold3实现高精度的生物分子建模

  • A+
分享一篇发表在Nature上的文章,文章标题“Accurate structure prediction of biomolecular interactions with AlphaFold3”,文章的通讯作者是来自Google DeepMind的John M. Jumper,Isomorphic Labs的Max Jaderberg,以及以上两个公司的创始人Demis Hassabis。其中Isomorphic Labs致力于AI制药方面的研究。1


AlphaFold2(AF2)是精确建模蛋白质结构的一座里程碑。在过去的三年中,AF2已经被广泛应用于蛋白质建模和设计中。但是,AF2只能预测蛋白的结构,实现更广泛的复合物结构预测仍是一个不小的挑战。目前发展的复合物结构预测方法大多数局限于特定的复合物类型(如蛋白质-核酸复合物),无法泛化至其它复合物类型。最近Krishna等人发展的RoseTTAFold All-Atom模型(10.1126/science.adl2528)为解决此问题带来希望,但是其模型的预测精度有待进一步提高。
在本文中,作者发展了AlphaFold3(AF3)模型,能够以较高的精度预测几乎所有类型的生物复合物。作者进一步更新AF2的模型架构以适应更一般的复合物建模。主要改进如下:在输入层面,针对小分子输入,使用RDKit生成可能的构象;使用Pairformer模块替换原有的Evoformer模块,简化所需MSA的数量;在输出层面,使用扩散模型直接预测原子坐标。在模型评估中,AF3在包括蛋白质-小分子配体、蛋白质-核酸、蛋白质的共价修饰、蛋白质-蛋白质等几乎所有类型的任务上均超越了现有方法。
2
然而,AF3仍存在一些局限性。其一,错误的立体化学预测。AF3可能错误预测分子手性(尽管在输入过程中提供了手性信息),预测得到的原子也可能发生重叠;其二,模型幻想问题。AF3预测可能将无序区域预测成虚假的有序结构;其三,无法预测蛋白质的动态结构。即使改变扩散模型中的随机种子,模型也无法很好估计溶液状态下蛋白质的结构系综,对于某些多构象的蛋白质,AF3只能预测其中一种构象。
8
最后需要指出的是,AF3并不提供源代码(只提供用于描述算法的伪代码),目前使用AF3的唯一途径是通过AF3服务器(https://www.alphafoldserver.com/)进行预测。在蛋白-小分子配体复合物的结构预测上,用户只能输入服务器提供的有限数量的小分子,共包括:ATP、ADP、AMP、GTP、GDP、FAD、NAD、NADP、NADPH、Heme、Heme C、棕榈酸、油酸、豆蔻酸、柠檬酸、叶绿素A、叶绿素B、细菌叶绿素A、细菌叶绿素B。
本文作者:ZF
责任编辑:FTY
文章链接:https://www.nature.com/articles/s41586-024-07487-w
原文引用:DOI10.1038/s41586-024-07487-w



weinxin
我的微信
关注我了解更多内容

发表评论

目前评论:0