精选
|
AI 为科学家带来了超强能力——但可能缩小了科学的范围
对 4100 万篇论文的分析发现,尽管人工智能扩大了个人影响力,却缩小了集体的科学探索
随着 ChatGPT 等人工智能工具在企业和大学中站稳脚跟,一个熟悉的说法很难回避:人工智能不会取代你,但使用人工智能的人可能会。

今天发表在《自然》杂志上的一篇论文表明,这种差距已经在自然科学领域造成了赢家和落后者。在迄今为止同类研究中规模最大的一项分析中,研究人员发现,拥抱任何类型人工智能的科学家——从早期的机器学习方法一直到今天的大语言模型——在职业发展上都持续取得最大的进步。与不使用人工智能的同行相比,采用人工智能的科学家发表的论文数量是其三倍,获得的引用量是其五倍,并且更快达到领导职位。
但研究表明,科学整体正在为此付出代价。人工智能驱动的研究不仅倾向于围绕同样拥挤的问题展开,还导致科学文献之间的联系减少,相互引用和相互借鉴的研究越来越少。
“我对这项分析的规模和范围感到非常惊讶,”康奈尔大学的计算社会科学家尹伊安(Yian Yin)说,他研究过大语言模型对科学研究的影响。“人工智能工具的多样性以及我们在科学研究中使用人工智能的方式非常不同,这使得量化这些模式变得极其困难。”
耶鲁大学的社会文化人类学家莉萨·梅塞里(Lisa Messeri)补充说,这些结果应该为整个科学界敲响“响亮的警钟”。“科学不过是一项集体努力,”她说,“我们需要认真思考,当一种工具对个人有利却破坏科学时,我们该怎么办。”
为了揭示这些趋势,研究人员从 1980 年至 2025 年发表的超过 4100 万篇论文入手,涵盖生物学、医学、化学、物理学、材料科学和地质学等领域。首先,他们面临一个重大障碍:弄清楚哪些论文使用了人工智能——这一类别从早期的机器学习一直延伸到今天的大语言模型。“这是人们多年甚至几十年来一直试图解决的问题,”尹说。
该团队的解决方案很合适:使用人工智能本身。研究人员训练了一个语言模型来扫描标题和摘要,并标记可能依赖人工智能工具的论文,最终在数据集中识别出约 31 万篇此类论文。随后,人类专家对部分结果进行了审核,确认该模型的准确性与人类审稿人相当。
借助这部分论文,研究人员得以衡量人工智能对科学生态系统的影响。在人工智能的三个主要时代——1980 年至 2014 年的机器学习、2016 年至 2022 年的深度学习,以及 2023 年以后的生成式人工智能——使用人工智能的论文每年获得的引用量几乎是未使用人工智能论文的两倍。在整个职业生涯中,采用人工智能的科学家发表的论文数量是同行的 3.02 倍,获得的引用量是同行的 4.84 倍。
这种优势也延伸到了职业发展轨迹上。研究人员聚焦数据集中的 200 万名研究人员,发现使用人工智能的青年科学家更不容易退出学术界,更有可能成为成熟的研究领导者,并且比未使用人工智能的同行提前近 1.5 年达到这一地位。
但对个人有利的并不一定对科学有利。当研究人员观察人工智能驱动研究覆盖的整体主题范围时,他们发现人工智能论文覆盖的领域比传统科学研究少 4.6%。
研究团队推测,这种聚集源于一个反馈循环:热门问题推动了大规模数据集的创建,这些数据集使人工智能工具的使用更具吸引力,而使用人工智能工具取得的进展又吸引更多科学家关注同样的问题。“我们就像群居动物,”该研究的合著者、芝加哥大学的计算社会科学家詹姆斯·埃文斯(James Evans)说。
这种拥挤也体现在论文之间的引用关系上。在许多领域,新思想通过密集的论文网络发展——这些论文相互引用、改进方法并开启新的研究方向。但在所有自然科学学科中,人工智能驱动的论文所引发的互动减少了 22%。相反,它们倾向于围绕少数“超级明星论文”展开,不到四分之一的论文获得了 80% 的引用。
“当你的注意力被像(蛋白质折叠模型)AlphaFold 这样的明星论文吸引时,你所想的只是如何在 AlphaFold 的基础上继续发展,并比其他人更快做到,”清华大学的合著者徐丰利(Fengli Xu)说,“但如果我们都去攀登同一座山,那么就会有很多领域无人探索。”
“科学正在经历罕见程度的颠覆,”西北大学研究科学学的王大顺(Dashun Wang)说。生成式人工智能的迅速崛起——它正在以许多科研机构难以跟上的速度重塑研究工作流程——只会让风险更高,让科学的未来形态更加不确定。
但科学范围的收窄或许仍可逆转。延世大学研究科学学的心理学家林志诚(Zhicheng Lin)说,一种应对方式是在尚未大量使用人工智能的领域建立更好、更大的数据集。“我们不能通过强制远离数据密集型方法来改善科学,”他说,“更光明的未来在于让更多领域拥有更丰富的数据。”
该研究的合著者、清华大学研究人工智能与科学学的李勇(Yong Li)说,从长远来看,未来的人工智能系统也应该超越处理数据的阶段,发展成为具有科学创造力的自主智能体,这可能会再次拓宽科学的视野。
在那之前,埃文斯说,科学界必须认真思考这些工具如何全面影响了科研激励机制。“我不认为人工智能必须这样塑造科学,”他说,“我们希望看到的世界是:获得更多资金、增长更快的人工智能增强型研究,能够催生新的领域——而不是仅仅在旧问题上不断加码。”
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2026-1-17 11:30
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社