||
最近物理学诺奖获得者Parisi用联手Claude,40轮对话证明了物理中存在了12年的一个猜想,这件事在科学界特别是理论物理学界引起了注意。Parisi的这件工作的科学价值现在不好评价。一位在前AI时代且功成名就的物理学家居然依然傲立AI的潮头,并详细给出了解决这一理论物理学前沿课题的全过程,对AI时代的教学和科研具有重大的指导性意义。值得注意的是,他同时思考了AI时代科学家的不可替代性,这个不可替代性思考即将在返朴上发布。下面是他发布的如何证明这个猜想的流程图的意大利语版本和中文翻译版本:


Parisi的工作和思考,比较完整地反映在提前发布的Nature的评论(comment)文章中,文章的核心观点是:
“人工智能并非正在取代这些领域中的人类直觉,而是在重新构想问题被提出、探索和理解的方式。”
这一点,很好地符合笔者本文使用AI的经验:使用AI处理一个教学疑难问题的全过程和Parisi的忠告
----
以下是今天Nature在线发布的评论文章,文章正式发表的日期是后天(6月11日) (文章附在本文末)
人工智能如何重塑数学与物理学中的发现
Mikhail Burtsev、Yang-Hui He、Evgeny Sobko、Thore Graepel 和 Ananyo Bhattacharya
人工智能并非正在取代这些领域中的人类直觉,而是在重新构想问题被提出、探索和理解的方式。
在数学科学领域,人工智能引发了一系列反应。有些人认为它与自己的工作无关;另一些人则担心它可能侵蚀其领域中最具创造性、智力回报最高的方面。然而,从我们团队在伦敦数学科学研究所及其他地方所做的工作中浮现出的真相则更为微妙。如今,软件可以逐行检查证明,捕捉到过去需要数月人工仔细审查才能发现的错误。它可以系统地搜索反例——检验一个猜想是否真的成立,或以意想不到的方式失败。它还可以在论证中提出中间步骤,给出有用的辅助结果,帮助弥合已知内容与尚需证明内容之间的差距。
在实验领域,原型AI科学家正开始自动化发现周期的部分环节,但它们仍然受到物理世界需求的限制:混合试剂、培养细胞、等待反应以及应对数据中的噪声。数学和理论物理学面临的瓶颈要少得多。“实验”廉价、快速且数字化,而数学数据——从素数到流形等抽象结构的属性——干净且丰富[1]。
开发针对数学推理的AI系统的公司在过去一年报告了稳步进展。位于加利福尼亚州帕洛阿尔托的软件公司Harmonic开发的Aristotle系统,已帮助解决了多产数学家Paul Erdős提出的几个问题——这些问题易于陈述但以难以攻克著称。位于帕洛阿尔托的初创公司Axiom Math宣布,其AI工具找到了许多专业数学家尚未解决的研究级问题的解决方案。与此同时,位于加利福尼亚州旧金山的OpenAI和位于伦敦的Google DeepMind等科技公司的模型已经解决了First Proof Project中的几项挑战,该项目是一组困难的数学问题,用于测试AI系统是否能生成新的、可验证的结果。
在此,我们列举了过去几年在这个快速发展的领域中取得进展的例子,概述了AI为理论领域科学家和数学家带来的机遇——并邀请研究人员积极将AI应用于他们的工作中。
研究流程
在理论物理和数学中,研究人员将创造性洞察和严谨的逻辑推理相结合以做出发现——但这个过程只有部分被理解,对于突破如何发生,没有单一的解释。为了清晰起见——并不提出一个确定的模型——我们将这个过程分为几个重叠的阶段:设定议程、形式化思想、提出猜想以及求解与验证结果。这个框架并不完美,但它提供了一种有用的方式,来评估AI已经在哪些领域做出贡献,挑战在哪里,以及如何应对这些挑战。
设定议程
研究中最具人类特色的行为之一,就是首先决定哪些问题值得提出。这些问题可能来自领域外部——通过现实世界的问题或与相邻学科的接触——也可能来自内部,因为理论会根据自身的内部逻辑和审美标准而演变[2,3]。这些来源是相互交织的:具体问题可以产生新概念,而抽象理论可以重塑并深化原始问题。
今天的AI系统对这些更广泛背景的访问权限有限。因此,它们缺乏直觉和“品味”:即缺乏对问题从何而来、什么使它们及时、以及它们如何融入一个领域不断演变的结构的感觉。例如,物理学家阿尔伯特·爱因斯坦在注意到经典力学和描述电与磁相互作用的麦克斯韦方程组中处理光波的方式存在矛盾后,发展了他的狭义相对论。
“数学家可以受益于一个坚持每条推理都必须明确化的系统。”
一个充满希望但尚未充分探索的方向是,构建能够帮助研究人员根据研究者选定的标准来排序和优先处理潜在问题的AI系统。例如,AI可以在扫描大型数学数据库(如整数序列在线百科全书)或预印本存储库(如arXiv)时遵循这些标准,以识别被忽视的联系和领域间的结构相似性。以这种方式使用,AI可能会加深我们对科学家如何识别富有成果的发现方向的理解。
形式化思想
许多重要的思想在能被精确定义之前就已成形。一个经典的例子是理查德·费曼引入的路径积分,它通过设想某事物可能发生的所有方式并将它们组合起来,来描述量子系统。尽管这个想法从未在严格的数学意义上被完全确定,但它塑造了现代物理学,并激发了数学领域的新工具[4]——例如,区分不同类型纽结的方法,以及计算复杂几何图形中形状数量的方法。
将一个非正式的、散文式的论证转化为计算机可以处理的形式,通常需要付出大量努力:重构省略的步骤,填补看似明显的空白,并使隐式假设明确化。但这个过程可以加深理解并暴露错误。例如,当加州大学洛杉矶分校的数学家陶哲轩通过证明助手(Lean4)运行他自己一篇论文中的论证以进行检查时,他发现了一个微妙的逻辑漏洞。一个看似清晰的步骤并未得到严格证明。
即使是最有成就的数学家,也能从一个坚持每条推理都必须明确化的系统中受益。减少形式化中涉及的人力劳动,将带来更大、更高质量的已验证数学知识库,这些知识库反过来又可用于训练更好的AI模型。完全自动化形式化是长期目标。
进展已经相当显著[5],但仍然需要人工输入。例如,由伦敦帝国理工学院的数学家Kevin Buzzard领导的Xena项目,已动员大学生系统地数字化本科数学课程中的所有证明。
AI正开始帮助扩展此类任务。瑞典哥德堡查尔姆斯理工大学的计算机科学家兼数学家Josef Urban使用大型语言模型形式化了拓扑学中的定理——拓扑学研究形状在被拉伸或扭曲时的性质。
提出猜想
猜想是对一个适定问题的合理解答——也就是说,一个看起来可能是真的但尚未被证明的有根据的猜测。AI现在可以生成猜想,但其作用仍然是试探性的,并与人类监督紧密结合。
这对于计算方法来说并非新领域。早期的专用计算机程序——如Graffiti[6]和拉马努金机器[7]——表明算法确实可以提出新的数学思想,而不仅仅是检查现有的。例如,Graffiti在网络(连接点的简单图表)中发现了意想不到的模式,这些模式后来在化学中被证明是有用的,在化学中,分子可以根据其原子连接的方式被理解。拉马努金机器为基本数学常数提出了令人惊讶的简单公式。类似的方法现在正被应用于理论物理学,帮助研究人员发现隐藏的模式和精确公式[8,9,10]。
然而,在实践中,AI会生成许多猜想,其中大多数是平凡的、已知的结果或错误的。人类专家仍然决定哪些值得追求。例如,2021年,AI帮助缩小了一个关于代数和几何结构的数学“纽结”转化为一个严格定义的猜想,随后被人类证明[11]。
2022年,使用AI分析椭圆曲线(数论或整数研究中的重要数学对象)大型数据集的研究人员注意到,一些关键性质的变化方式出现了一个意想不到的模式。当他们绘制数据时,发现数据并非随机散布,而是形成了波浪状的带状结构,类似于椋鸟的群飞行为,被称为“murmurations” [12]。揭示这样的模式可能被证明在许多数学领域具有变革性[9]。
下一步可能是将AI增强的猜想生成与议程设定联系起来。AI系统不是在一个固定领域内盲目工作,而是可以首先绘制现有的数学知识图谱,以识别瓶颈、空白和意想不到的相似之处,然后生成猜想以弥合它们。
求解与验证结果
2025年,DeepMind发布了AlphaEvolve[13],一个可以对开放问题提出、测试和优化算法解决方案的编码智能体。随后不久,专家们在67个挑战上对其进行了测试;在大多数情况下,它重新发现了已知的最佳解决方案,并在几个案例中改进了它们[14]。
AlphaEvolve将谷歌AI模型Gemini的生成推理能力与评估候选解决方案的自动化系统相结合,使用“进化搜索”策略迭代开发最有前景的方案。它已经展示了推进数学知识的能力,例如,发现了用于矩阵乘法(用于物理学、数据科学和计算机科学的多个领域)的改进算法。与此同时,5月,OpenAI宣布他们使用大型语言模型反驳了单位距离问题(一个由Erdős于1946年首次提出的几何猜想)——这也许是机器产生的第一个重大数学成果。这些成功是显著的,尽管整体技术水平仍然有限,但它们表明进展的步伐正在加快。
“目前,决定性的创造性飞跃仍然由人类完成。真正的希望在于伙伴关系。”
使用AI来检查证明——或验证它们——是一个更成熟的应用。证明助手已经可以逐行检查复杂的论证,它们不断增长的库为AI辅助推理提供了结构化的基础。复杂定理的形式化验证表明,这些工具正接近在研究前沿常规使用[15]。
与其说是一个全能型的“AI数学家”,进展更可能来自专门智能体的生态系统——生成者、反驳者、审视者、教育者——它们的相互作用产生可靠的知识。未来的AI工具可能会更进一步,尝试如何解决问题的方法,并判断哪些策略能带来更快、更清晰的证明。
展望未来
能够建议证明步骤、揭示隐藏模式并解决竞赛级问题的AI系统,现在正在以五年前难以想象的方式协助数学家。然而,数学和物理学中最深层次的进步往往需要全新的概念或范式,而目前还没有AI系统能够发明它们。
AI可以搜索广阔的空间并发现意想不到的规律;人类则带来判断力、品味和发明全新思维方式的能力。这种合作已经在产生新的成果。理论不是已解决问题的一条装配线;它是人类理解的一张不断扩展的地图。早期的工具,如计算器和计算机代数系统,并没有削弱数学领域——它们提升了数学。AI也可以做同样的事情,扩展我们的认知范围,就像望远镜曾经扩展了我们的视野一样。
未来的系统必须能够解释它们的见解,指导进入新领域的研究人员,并帮助组织不断增长的知识体系。任务是谨慎而雄心勃勃地构建这些系统。如果它们能让前沿变得更易于探索——并且更深入地相互关联——它们将加速发现,而不是取代发现者。
参考文献
1. Fink, T. Nature 629, 505 (2024).
2. Hilbert, D. Bull. Am. Math. Soc. 8, 437–439 (1900).
3. von Neumann, J. in Works of the Mind Vol. I 180–196 (Univ. Chicago Press, 1947).
4. Atiyah, M., Dijkgraaf, R. & Hitchin, N. Phil. Trans. A Math. Phys. Eng. Sci. 368, 913–926 (2010).
5. Weng, K. et al. Preprint at arXiv https://doi.org/10.48550/arXiv.2505.23486 (2025).
6. Fajtlowicz, S. in Annals of Discrete Mathematics Vol. 38 (eds Akiyama, J., Egawa, Y. & Enomoto, H.) 113–118 (Elsevier, 1988).
7. Raayoni, G. et al. Nature 590, 67–73 (2021).
8. He, Y.-H. The Calabi-Yau Landscape (Springer, 2021).
9. Douglas, M. R. Nature Rev. Phys. 4, 145–46 (2022).
10. He, Y.-H. Nature Rev. Phys. 6, 546–553 (2024).
11. Davies, A. et al. Nature 600, 70–74 (2021).
12. He, Y.-H., Lee, K.-H., Oliver, T. & Pozdnyakov, A. Exp. Math. 34, 528–540 (2025).
13. Novikov, A. et al. Preprint at arXiv https://doi.org/10.48550/arXiv.2506.13131 (2025).
14. Georgiev, B., Gómez-Serrano, J., Tao, T. & Wagner, A. Z. Preprint at arXiv https://doi.org/10.48550/arXiv.2511.02864 (2025).
15. Gowers, W. T., Green, B., Manners, F. & Tao, T. Ann. Math. 201, 515–549 (2025).
作者声明存在竞争利益;详见 go.nature.com/3s8jut。
---
Mikhail Burtsev 是英国伦敦伦敦数学科学研究所的AI研究员。
Yang-Hui He 是英国伦敦伦敦数学科学研究所的研究员。
Evgeny Sobko 是英国伦敦伦敦数学科学研究所的研究员。
Ananyo Bhattacharya 是英国伦敦伦敦数学科学研究所的首席科学作家。
Thore Graepel 是英国伦敦Google DeepMind的研究科学家。
电子邮箱:ab@lims.ac.uk
How AI is reshaping discovery in maths and physics-Full.pdf
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2026-6-10 23:05
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社