周苑分享 http://blog.sciencenet.cn/u/yaoqizhou 论春语秋,谈科说学,声传言教。

博文

万圣节露面的AlphaFold3,是trick还是treat(是给糖还是捣蛋)? 精选

已有 3539 次阅读 2023-11-2 14:41 |个人分类:科技推广|系统分类:科研笔记

每年10月31日是西方的万圣节(Halloween),小朋友都喜欢在这个节日里打扮成各种各样的妖魔鬼怪,去邻居家门口大喊:“trick or treat (给糖还是捣蛋) ?”。今年万圣节,Google Deepmind公司联合新成立两年的、从Deepmind独立出来的公司 Isomorphic Labs 共同发布了新一代AlphaFold模型:AlphaFold3【1】。但只宣耀了结果,没有具体方法的介绍,更没有详细的讨论了,纯粹像是一个在万圣节露面的孩子:这到底是trick还是treat? 

这个在网站上发布的新闻稿,虽然有20页,包括一页摘要,一页目录,三页引言和模型的输入/输出,七页结果,一页结论,其他附录为评判标准和表格,但就是没有详细介绍方法的设计和训练的手段,声称是进展报告(work in progress)。从报告的结果来看,AlphaFold3改变了以前AlphaFold2只能用于蛋白质结构预测的局限性,而使它能够预测跟其它分子的复合物结构,包括小分子配体、多肽、多糖、蛋白质、核酸(DNA 和RNA)以及含有翻译后修饰(PTM)的生物分子,可以说是包罗万象了。

通用性有了,准确性呢?从目前的结果来看,它在蛋白质复合物和RNA结构方面的准确性还没有达到2020年AlphaFold2对蛋白质单体结构高精度预测的惊艳表现,只是似乎比目前最好的预测复合物方法(SOTA)提高了不少。但是对蛋白质-蛋白质相互作用介面的高精度预测只在30%的复合物中实现了,对抗体-抗原复合物更少,只有17%。对蛋白质-配体相互作用,只有50%左右实现了RMSD<2Å的预测。对于CASP15的RNA结构预测,AlphaFold3仍旧低于去年获得第一名,基于我们BRiQ统计势函数的AIchemy_RNA2方法【2,3】。

由于没有提供新方法的训练和测试的详细说明,无法真正判断AlphaFold3的泛化能力如何,特别是对于从来没有见过的分子或者结构,甚至没有相互作用的分子,是不是也会给出一个像模像样的、但是完全不存在的复合物结构?也就是说,到底是trick还是treat,我们还需要拭目以待!不管如何,AlphaFold3直接用于创新药物设计或RNA结构预测仍是任重道远,毕竟即使是AIchemy_RNA2,也没有对一个RNA的结构达到了高精度预测(RMSD<2Å)。

大而全不一定就是大而美。

1A glimpse of the next generation of ALphaFold. https://www.isomorphiclabs.com/articles/a-glimpse-of-the-next-generation-of-alphafold

【2】K. Chen, Y. Zhou, S. Wang, and P. Xiong. RNA tertiary structure modeling with briq potential in casp15. Proteins: Structure, Function, and Bioinformatics, 2022. doi: 10.1002/prot.26574. 

3P. Xiong, R. Wu, J. Zhan, and Y. Zhou. Pairing a high-resolution statistical potential with a nucleobase- centric sampling algorithm for improving RNA model refinement. Nature Communications, 12(1): 2777, May 2021. ISSN 2041-1723. doi: 10.1038/s41467-021-23100-4. 


周耀旗课题组简介:周耀旗教授于20213月起作为资深研究员全职加入了深圳湾实验室,他是1984年中国科技大学近代化学系的学士,1990年美国纽约州立石溪大学化学物理的博士,1994-2000年北卡州立大学、哈佛大学的博士后,2000年任纽约州立布法罗大学助理教授,2004年升为终身副教授,2006年成为印第安纳大学信息学院和医学院终身正教授,2013-2021年任澳大利亚格里菲斯大学糖组学研究所正教授。他的科研成果的原创力和影响力获得了世界专家同行的肯定,特别是在基于AI蛋白质设计和主链结构预测上做出了原创性贡献,并多次入选了全球前2%顶尖科学家终身科学影响力排行榜年度科学影响力排行榜中国高被引学者(生物学)榜等。截至目前共发表同行评审的论文260多篇,包括NatureNature MethodsGenome BiologyNucleic Acids Research等国际知名期刊。谷歌学者总引用17,000余次,H因子70。并培养了十多名美国、加拿大的副教授和教授,中国的海外优青。回国后,他获得了中国科技部、国家基金委、广东省科技厅等多个重大科研项目的资助,并作为创始人之一创建了砺博(广州)生物科技有限公司,致力于靶向RNA小分子创新药的研发。目前课题组通过AI计算和高通量实验的结合,从事蛋白质/RNA的序列、结构与功能关系方面的基础研究和生物分子检测、药物开发方面的应用研究。寻找在RNA/蛋白方面有定向进化,分子及细胞生物学实验和AI计算相关经验的博士后。有兴趣者请访问http://zhouyq-lab.szbl.ac.cn



https://blog.sciencenet.cn/blog-472757-1408170.html

上一篇:[转载]3=1+2:分割是如何攻克蛋白质结构预测的?下一步将走向何方?
下一篇:RNA语言模型也来了!
收藏 IP: 113.89.52.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-3-3 06:40

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部