哲学驿站分享 http://blog.sciencenet.cn/u/老李 一个行走者的思想历程

博文

推动科学发展的新载体与新工具可以尘埃落定了 精选

已有 579 次阅读 2026-1-20 21:35 |系统分类:观点评述

N0XWGQC0SMJ21547760856397.jpg

推动科学发展的新载体与新工具可以尘埃落定了

——以DeepMind公司的发展为例

吴玲玉 李侠

(上海交通大学科学史与科学文化研究院)

新时代应该如何推动科技发展,新科研范式在决策层面遭遇到的基础性选择难题有哪些?在实践层面的具体抓手又是什么?这些都是当下亟需深入思考与研究的问题。基于本团队近五年来的研究,笔者认为在决策层面,管理部门遇到的最大决策选择难题在于深刻解析推动新科技发展的底层力量到底是理论还是工具?如果研究证实是理论在持续地推动科技发展,那么加强基础研究就是当下科技决策的首要任务(这也是20世纪科技发展的经典模式:理论优先,即万•布什的线性发展模型);反之,如果工具是新时代推动科技发展的底层力量,那么决策部门就要有针对性的扩张大科学工程的规模,通过新科学基础设施的进步带动科技的进步(如近年来世界范围内各种耗资巨大的大科学工程的纷纷上马)。遗憾的是推动科技发展的力量到底是理论还是工具,目前仍有很多深层次问题并没有得到彻底解决,科技共同体的分歧仍很大,在这种背景下,第三种策略就是折中策略,维持理论与工具两者共同发展的局面,在资源的硬性约束下,只需调整好两者的比例即可,虽然不是最优策略,但至少不是最差选择。就笔者的观察来看,中国在推动科技发展的决策选择上显然是采用第三种策略,即“双轨推进”策略,所不同的只是在两者的结构、比例与构成如何安排上尚没有达成充分的共识,目前仍处在实验摸索阶段。

在实践层面的具体抓手应该是什么?换言之,推动科技发展的主要载体应该选择哪类载体?目前人们熟知的国家战略科技力量主要包括如下四种:国家实验室、国家科研机构、高水平研究型大学和科技领军企业,这四类载体在整个知识生产链条上是有明确分工的,在科技日益一体化的今天,要能在短时间内快速实现“从0到1”的突破,需要知识生产条件高度密集化,这就需要支撑知识生产的要素实现高度集聚,如人财物的高密度集聚,并辅以最大化自由度与激励机制,能够满足这个条件的载体只有高科技企业。这也是笔者近年来一直在尝试论证的命题:推动科技发展的新载体是高科技企业,新的支撑性工具是人工智能。未来其他科技载体都无法与之抗衡。对此,我们不妨以高科技公司DeepMind为例,看看它是如何推动科技加速发展,并以此支撑本文的论点。

1、 蛋白质折叠问题及其发展

蛋白质作为生命活动的主要执行者,参与了细胞生命活动的每一个进程。然而要想全面了解蛋白质在健康机体中的功能或在病理状态下的异常表现,必须先解析其三维结构。1972年诺贝尔化学奖得主克里斯蒂安·安芬森(Christian Anfinsen,1916-1995)于1972年提出了安芬森假说(Anfinsen's dogma)确定了氨基酸序列决定蛋白质结构的理论基石[[1]],但由于学界尚不清楚这一物理过程的具体机制,从而引发了困扰学界半个世纪的“蛋白质折叠问题”:蛋白质的氨基酸序列如何决定其结构[[2]]。解析蛋白质结构已经成为生命科学领域的重要问题,无数机构与科学家投入这个领域,缓慢推进其发展。

2020年11月,谷歌DeepMind公司推出AlphaFold2技术,展示了人工智能技术如何仅仅使用氨基酸序列就能精准模拟出对应的蛋白质结构,从此,标志着困扰学界50多年的蛋白质折叠问题得到几乎彻底解决;2024年5月,谷歌DeepMind公司推出AlphaFold3,进一步拓宽了预测的边界,实现了预测复合物的结构,从而开启了解析生命相互作用机制的新的一页。DeepMind到底是一家什么样的公司,它与科技进步又有什么样的关系?这种变化是否透露出未来科技发展的一种隐而不显的内在密码?

2、DeepMind的前世今生与AlphaFold的横空出世

为了深入理解AlphaFold技术如何通过变革重塑科学界,我们需要回溯其研发机构DeepMind公司的发展历程。DeepMind于2010年在伦敦成立,其早期创始人为戴密斯·哈萨比斯(Demis Hassabis,1976-)、谢恩·莱格(Shane Legg,1975-)和穆斯塔法·苏莱曼(Mustafa Suleyman,1984-),三人有着神经科学、机器学习和系统工程的交叉学科背景。在公司成立之初,其核心愿景并非解决具体的科学问题,而是追求“通用人工智能”(AGI)。哈萨比斯曾表示,公司的使命是“解决智能,然后用它解决一切”[[3]]。

DeepMind公司选择了游戏作为人工智能实现通用人工智能的突破口。自20 世纪50年代计算机科学家开发出第一批国际象棋程序以来,游戏一直是人工智能的训练场所。由米尼赫(Vlad Mnih)领导的DeepMind研究团队开始构建首个利用强化学习直接从高维感官输入中成功学习控制策略的深度学习模型,并将该模型用雅达利游戏进行训练,挑战了包括《太空侵略者》(Space Invaders)、《乒乓》(Pong)和《打砖块》(Breakout)等在内的一系列经典游戏,实验结果表明,该模型在多款游戏中均展现出了超越人类专家的水平[4]][[5]]。

凯德·梅茨(Cade Metz)在其著作《Genius Makers》中指出,使用游戏训练AGI与其成功密不可分:游戏分数是一个客观的量化标准,具有十分明确的结果。

但DeepMind早期的研发遇到了严峻的现实挑战。根据 OpenAI 关于 AI 算力增长趋势的分析,深度学习对硬件的需求呈指数级增长[[6]],这使得 DeepMind 要想进一步提升模型性能,将不得不面对巨大的算力缺口。2014年,谷歌公司以约4亿美元的价格收购了DeepMind[[7]],这次收购解决了DeepMind公司遭遇到的算力不足的发展瓶颈,而且更重要的是,依靠谷歌公司的强大经济实力,DeepMind的发展得到了全方位的支持,2021年,DeepMind分拆成立了Isomorphic Labs,专注于将人工智能和计算方法应用于药物研发。2023年4月20日,谷歌母公司Alphabet合并旗下两个主要的人工智能研究部门——Google Brain(谷歌大脑)和DeepMind。经过这番组织架构的调整,DeepMind公司已经成为当今全球人工智能领域里实力最强的前沿高科技公司,其所展现出的核心技术与未来潜力向市场发出邀约。众所周知,资源支撑、技术迭代与组织效率是高科技公司能够幸存下来的深层原因。Google的加入为DeepMind提供了强大的算力资源和基础设施,使其成为推动科技持续发展的最佳载体,再加上作为工具/目标的人工智能本身的加持,为后续包括AlphaFold在内的一系列科学突破提供了不可或缺的载体与工具支持。

新载体与新工具对科技的推进作用可谓立竿见影,2016年3月,DeepMind开发的AlphaGo程序以4:1击败韩国围棋冠军李世石[[8]],成为近年来人工智能领域少有的里程碑事件。2017年,DeepMind发布了AlphaGo Zero,在自我训练3天后以100-0击败了AlphaGo。2018年,DeepMind发表了AlphaZero,不仅能下围棋,还能下将棋和国际象棋。这一系列成果印证了训练充分的深度学习模型在处理复杂博弈问题时,能够展现出超越人类专家的计算和决策能力。自此人工智能的能力获得整个社会的充分认可。

在游戏领域取得巨大成功后,DeepMind转向了利用深度学习模型来解决现实世界中的科学难题,在经过深思熟虑之后,研究团队选择了“蛋白质折叠”这一课题作为公司研究的突破口。据DeepMind创始人哈萨比斯回顾,这一选择并非偶然,而是出于多种因素的考虑:首先,哈萨比斯早年意识到人工智能技术可以应用于解决蛋白质折叠问题;其次,他坦言受到了一款名为《Foldit》游戏的启发,这款游戏可以模拟蛋白质折叠的真实过程,并且启发了现实中几种蛋白质结构的发现,让他意识到解决游戏问题也可以解决真实的科学问题[[9]]。最后,蛋白质折叠问题和游戏训练具有高度的相似性,都具有客观的评价标准和明确的结果,如输出的蛋白质结构可以利用GDT_TS标准得到一个确定的分数。这一精准的选题策略是AlphaFold后续成功不可或缺的关键因素。

3CASP的评价与科研范式转移:新载体与新工具功能的确认

在新载体与新工具介入科技发展进程后,如何衡量科技发展的绩效?这是衡量本文立论是否可以成立的核心问题,换言之,怎么证明新载体与新工具的介入的确促进了科技的发展呢?回到蛋白质结构难题,CASP(Critical Assessment of Structure Prediction,蛋白质结构预测技术关键评估)这一竞赛可以很好地检验DeepMind公司的科研表现,可喜的是,后来的结果正式确认了AlphaFold2在攻克困扰生物学界半个世纪的“蛋白质折叠问题”上表现优异远超人类的预期,甚至可以说,它终结了人类缓慢与笨拙的传统研究范式,笔者甚至想问,那些曾被奉为神明的昂贵冷冻电镜还有多少市场?

CASP由美国马里兰大学的科学家约翰·莫尔特(John Moult)与合作伙伴Krzysztof Fidelis教授于1994年创立,为了评估和鉴定蛋白质结构预测的最佳手段,CASP全称为(Critical Assessment of Structure Prediction),“结构预测的关键评估”。CASP竞赛两年一次,现已成为国际上著名的蛋白质结构计算机预测比赛。该竞赛旨在建立一套客观、严格的“双盲“评估机制,以评估蛋白质结构预测领域的发展水平。组委会收集通过实验确定的蛋白质结构信息传递给注册的预测者,参加预测的团队,要在规定时间内构建出对应的结构模型,并由独立的评估人员进行仔细审查,给出相应的打分[[10]]。在AlphaFold技术面世前,CASP的比赛成绩曾长期处于低位,传统方法的预测精度始终难以突破瓶颈。

   2018年,DeepMind研制的AlphaFold1首次参加第十三届CASP竞赛,在自由建模赛道中展现出显著优于其他参赛方的预测性能,并打破了CASP竞赛成绩长期徘徊于低位的局面[[11]]。尽管AlphaFold1取得了冠军,并在预测蛋白质结构领域取得了突破,但距离精确预测蛋白质结构仍然有相当大的差距。究其原因,AlphaFold1本质上仍旧沿用了图像识别的思路——它试图通过学习大量数据,从中找规律以推测蛋白质的结构。这种方法虽然比传统手段更为有效,但在面对极其复杂的空间折叠时,依然显得捉襟见肘。一部分生物学家认为,这项技术仅仅是具有生物学意义,并不一定在现实中具有应用价值,长期来看,这项技术的出现并不能说明解决了生物学中的什么问题[[12]]。面对瓶颈,DeepMind团队放弃了在AlphaFold1的模型上继续发展的想法,进行了一次彻底的底层重构:他们开发了一种人工智能网络,该网络整合了关于决定蛋白质折叠方式的物理和几何约束的额外信息,并将这项技术引入到AlphaFold2中。

历史的转折点出现在第十四届CASP竞赛上,经过重构的AlphaFold2预测的结构在准确性上展现出了跳跃式的突破,其预测精度在统计学上已达到与实验方法(如X射线晶体学)相当的水平,即预测误差已落在实验测量误差的范围内[[13]],这一突破标志着蛋白质折叠问题得到了根本性的解决:借由AlphaFold2,我们能从给定的氨基酸序列精准预测对应的蛋白质三维结构。AlphaFold2的成功平息了此前的众多质疑,并确立了以深度学习为代表的人工智能技术在推进结构生物学发展方面的杰出表现。

AlphaFold技术带来的改变远不止于此。随着AlphaFold3的问世,DeepMind研究团队已经不满足于能够对单个蛋白质结构进行高精建模,他们引入了生成式AI核心的“扩散模型”(Diffusion Model),使得AlphaFold3成功将预测范围拓展至包含蛋白质、核酸、小分子、离子以及修饰残基在内的复合物的结构。这意味着我们的视野能从单一的蛋白质折叠问题,转向更为复杂的解析生命的运行机制[[14]]。这些新工具的发明就如同当年伽利略的望远镜与列文虎克的显微镜,一个新世界的大门已经徐徐拉开,剩下的就是我们的接纳与展开了。

CASP竞赛图.jpg

历届CASP竞赛高难度目标得分显示:传统方法陷入停滞,自AlphaFold技术于第十三届CASP竞赛介入后引发变局 [[15]]

 

DeepMind公司在短短几年内引发的这一系列技术变革引发了生物学领域的范式革命。过去,科学家只能依赖观察实验得到蛋白质的结构,这一过程往往耗费几个月。现在,AlphaFold技术能够在几分钟内生成一个达到实验精度的蛋白质结构。“这将会彻底改变游戏规则,”德国马克斯·普朗克发育生物学研究所的进化生物学家安德烈·卢帕斯说道,他的实验室多年来一直试图破解一种细菌蛋白的结构,而AlphaFold只用了半个小时就给出了所需的结构。他预计这项技术将改变他的工作方式和研究方向。“这将改变医学,改变科研,改变生物工程,它将改变一切,”卢帕斯补充道[[16]]。

 

4、新载体与新工具将给未来的科学提供一幅怎样的图景

AlphaFold技术横空出世已经6年了,它的成功重新燃起了学界对AI for science的乐观预期。英国皇家学会发布了题为《人工智能时代的科学》(Science in the age of AI)的文件,深入探讨了人工智能技术会如何改变科学探究的本质和方法[[17]]。与此同时,由复旦大学、上海人工智能研究院与Nature Research Intelligence联合发布的《AI for Science》报告中指出人工智能正在科学研究中的创新与AI驱动的科学发现中实现深度融合,建立了一种变革性的研究范式[[18]]

回望以DeepMind为代表的高科技公司发展历程,DeepMind正通过一系列技术突破,持续拓展着这一新范式的边界。继AlphaFold大获成功后,DeepMind又陆续推出了一系列深度学习与科学研究相结合的技术,其中最引人瞩目的是2023年推出的GNoME,研究团队在《nature》上发布了利用GNoMe新发现的220万个新晶体,其中38万种具有高度稳定性,在实验合成中极具应用价值[[19]]。这份科研业绩是常规科学载体无法实现的,也是无法想象的,纵观全球经济,引领当代世界科技发展的主要力量几乎都是由高科技公司引领的,由此,我们可以肯定地得出如下两个结论:第一,新的科技发展需要新的载体,当今时代科技发展的最有效载体是高科技企业;第二,新载体与新工具的组合是实现科技范式转型的主要力量,缺一不可,所以人工智能就是新时代科技发展的最有力工具。就如同互联网与智能手机对于整个社会生活方式的改变一样。至此,可以明确地说:新时代科技发展的主导力量就是新科技载体与新工具的组合,回到本文话题就是高科技企业与人工智能的结合

从这个意义上说,营造良好的高科技企业生态环境建设与拓宽人工智能的应用渠道就是当下中国科技管理部门亟需解决的认知与决策问题,行文至此,刚刚得知,国内初创高科技公司Manus被美国高科技公司MeTa高价收购,虽然很遗憾,但这是一个警钟,如果不及时完善环境,未来会有更多的企业仿效。这一切都表明很多国家与企业都已经充分意识到新科技载体与新工具的组合恰恰是未来孕育科技革命的最基本配置,结论早已尘埃落定。

 

作者简介:

吴玲玉,上海交通大学科学史与科学文化研究院硕士研究生;

李  侠,上海交通大学科学史与科学文化研究院教授,

 

[[1]] Anfinsen C B. Principles that govern the folding of protein chains[J]. Science, 1973, 181(4096): 223-230.

[[2]] Dill K A, Ozkan S B, Weikl T R, et al. The protein folding problem: when will it be solved?[J]. Current opinion in structural biology, 2007, 17(3): 342-346.

[[3]] Hodson H. DeepMind and Google: the battle to control artificial intelligence[J]. The Economist, ISSN, 2019: 0013-0613.

[[4]] Metz C. Genius makers: The mavericks who brought AI to Google, Facebook, and the world[M]. Penguin, 2022.

[[5]] Mnih V, Kavukcuoglu K, Silver D, et al. Playing atari with deep reinforcement learning[J]. arXiv preprint arXiv:1312.5602, 2013.

[[6]] https://openai.com/index/ai-and-compute/

[[7]] Gibbs S. Google buys UK artificial intelligence startup Deepmind for£ 400m[J]. The Guardian, 2014, 27.

[[8]] Silver D, Huang A, Maddison C J, et al. Mastering the game of Go with deep neural networks and tree search[J]. Nature, 2016, 529(7587): 484-489.

[[9]] BBC News. DeepMind co-founder: Gaming inspired AI breakthrough[EB/OL]. 2020-12-2[2025-01-01]. https://www.bbc.co.uk/news/technology-55157940

[[10]] Moult J. A decade of CASP: progress, bottlenecks and prognosis in protein structure prediction[J]. Current opinion in structural biology, 2005, 15(3): 285-289.

[[11]] Senior A W, Evans R, Jumper J, et al. Improved protein structure prediction using potentials from deep learning[J]. Nature, 2020, 577(7792): 706-710.

[[12]] AlQuraishi M. AlphaFold at CASP13[J]. Bioinformatics, 2019, 35(22): 4862-4865.

[[13]] Jumper J, Evans R, Pritzel A, et al. Highly accurate protein structure prediction with AlphaFold[J]. Nature, 2021, 596(7873): 583-589.

[[14]] Abramson J, Adler J, Dunger J, et al. Accurate structure prediction of biomolecular interactions with AlphaFold 3[J]. Nature, 2024, 630(8016): 493-500.

[[15]] Protein Structure Prediction Center. Home Page [EB/OL]. [2026-01-02]. https://predictioncenter.org/index.cgi.

[[16]] Callaway E. 'It will change everything': DeepMind's AI makes gigantic leap in solving protein structures[J]. Nature, 2020, 588(7837): 203-205.

[[17]] The Royal Society. Science in the age of Al[EB/OL].

[[18]] Nature portfolio. AI for Science 2025[EB/OL]. [2026-01-02]. https://www.nature.com/articles/d42473-025-00161-3.

[[19]] Merchant A, Batzner S, Schoenholz S S, et al. Scaling deep learning for materials discovery[J]. Nature, 2023, 624(7990): 80-85.

AA1UlVWI.jpg

【博主跋】这篇小文章是2025年底12月30日年终聚会时定下的主题,最近几年我们小组一直在探究科技发展载体的变化问题,后续还有一篇相关小文章,等出来时再细聊,本文现发在2026-1-20的《三思派》微信公众号上,与李辉博士合作愉快,是为记!今日大寒,留作纪念!

说明:文中图片来自网络,没有任何商业目的,仅供欣赏,特此致谢!

2026-1-20于南方临屏涂鸦



https://blog.sciencenet.cn/blog-829-1519287.html

上一篇:我们爱什么?
收藏 IP: 114.86.21.*| 热度|

4 杨正瓴 刘进平 宁利中 王涛

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2026-1-21 00:25

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部