博文

人工智能的最新挑战：数学奥林匹克精选

已有 5272 次阅读 2024-1-23 07:18 |个人分类:科技资讯|系统分类:海外观察

谷歌DeepMind的解复杂几何问题的人工智能系统，展现了人工智能不断增长的逻辑推理能力，以及发现和验证新知识的能力。在过去几天中，从《纽约时报》到《麻省理工学院科技评论》网站诸多海外媒体，对此均有所报导。专家说，这是向具有更像人类的推理技能的机器，迈出了重要一步。

2024年1月17日，谷歌DeepMind和纽约大学的一个团队，在《自然》杂志上发布了一个新人工智能系统，名为AlphaGeometry（现在是谷歌DeepMind系列人工智能系统的一部分）。该系统是一个神经符号系统，由一个神经语言模型和一个符号推理引擎组成，它们一起工作来寻找复杂几何定理的证明。语言模型提供快速的“直觉”想法，符号推理引擎提供更深思熟虑的理性决策。

解数学问题需要逻辑推理，这是目前大多数人工智能模型不擅长的。语言模型擅长识别模式和预测流程中的后续步骤，然而，其推理缺乏数学解题所需的严谨性。另一方面，符号引擎纯粹基于形式逻辑和严格的规则，这使它能够引导语言模型走向理性决策。

这两种方法分别负责创造性思维和逻辑推理，共同解数学难题。这非常类似于人类解几何问题的方式，将他们现有的理解与探索性实验相结合。

AlphaGeometry解国际数学奥林匹克竞赛（IMO）的几何问题，其水平几乎与人类金牌得主相当。IMO可能是国际高中生最负盛名的竞赛。每年来自世界各地的学生争夺令人垂涎的铜牌、银牌和金牌（2023年有112个国家参加）。新的趋势是，人工智能程序可能很快也会参与竞争。

在对2000年至2022年的30个奥林匹克几何问题的测试（测试集称为IMO-AG-30）中，AlphaGeometry在时限内解了25个问题，而同期人类银牌得主的平均解了22.9个问题，金牌得主平均解了25.9个问题。也就是说，AlphaGeometry超越了人类银牌得主，接近于人类金牌得主。

国际数学奥林匹克竞赛这个年轻人才竞技场，而且已经成为数学和推理领域先进的人工智能系统的试验场。此前最先进系统称为吴方法（“Wu's method”），是由中国数学家吴文俊于1978年开发的，完成了10个问题。

图1 AlphaGeometry将几何定理证明器从低于人类水平提升到接近金牌得主的水平（参考资料[2]）

当遇到几何问题时，AlphaGeometry首先尝试使用其符号引擎生成一个由逻辑驱动的证明。如果仅使用符号引擎无法做到这一点，语言模型会在图中添加一个新的点或线。这为符号引擎继续寻找证据提供了额外的可能性。这个循环继续下去，语言模型添加有用的元素，符号引擎测试新的证明策略，直到找到一个可验证的解方案。

图2摘编自参考资料[2]，概述了AlphaGeometry如何解一个简单的问题。（a）简单的例子及其图示。（b）AlphaGeometry通过运行符号演绎引擎来启动证明搜索。引擎从定理前提中穷尽性地推导出新陈述（statements），直到定理被证明或新陈述被穷尽。（c）因为符号引擎未能找到证明，所以语言模型构造一个辅助点，在符号引擎重试之前增长证明状态。循环继续，直到找到解方案。（d）对于简单的例子，循环在第一个辅助结构“D作为BC的中点”之后终止。证明包含另外两个步骤，这两个步骤都利用了中点属性：“BD = DC”和“B，D，C共线”，图中用蓝色突出显示。

图2 神经符号AlphaGeometry如何解一个简单的问题（参考资料[2]）

为了训练AlphaGeometry的语言模型，研究人员创建了自己的训练数据，来弥补现有几何数据的不足。他们生成了近5亿个随机几何图，并将其输入符号引擎。该引擎分析每个图，并生成关于其属性的陈述。这些陈述被组织成1亿个合成证明，来训练语言模型。

[结语]

AlphaGeometry（解复杂的几何问题），代表了人工智能推理的突破。

以前的人工智能系统通常难以完成解复杂的几何问题所需的数学推理。

有专家称，除了数学之外，AlphaGeometry的影响还跨越了依赖几何问题解的各个领域，例如计算机视觉、建筑，甚至理论物理。然而，也有专家指出，仍有改进的余地。尽管AlphaGeometry可以解高中数学中的问题，但它还无法解大学教授的各种高级抽象问题。

DeepMind的新几何求解软件结合了两种不同的人工智能方法，这种混合方法可能有望解决其他领域的挑战 ——从物理学到金融 ——这些领域也需要明确的规则和更直观的方法来应用这些规则来解决问题。该软件的一个组件是神经网络，是该技术最近重大进步的主要原因。另一个组件是一个符号人工智能引擎，它使用一系列人类编码的规则来将数据表示为符号，然后操纵这些符号进行推理。在基于神经网络的深度学习在21世纪00年代中期开始迅速发展之前，从20世纪50年代到21世纪初的几十年里，符号人工智能曾经是一种流行的人工智能方法。

参考资料

[1] June Kimarchive page. Google DeepMind's new AI system can solve complex geometry problems.MIT Technology Review. January 17, 2024

https://www.technologyreview.com/2024/01/17/1086722/google-deepmind-alphageometry/

[2] Trinh, T.H., Wu, Y., Le, Q.V. et al. Solving olympiad geometry without human demonstrations. Nature 625, 476–482 (2024).

转载本文请联系原作者获取授权，同时请注明本文来自王宏琳科学网博客。
链接地址：https://blog.sciencenet.cn/blog-3005681-1418993.html

下一篇：漫谈平面镜反射

收藏 IP: 219.142.27.*| 热度|

当前推荐数：2 推荐人：彭真明 康建

该博文允许注册用户评论请点击登录评论 (1 个评论)

IP: 219.142.27.* 回复 | 1 +1 [1]王宏琳 2024-1-23 14:45: 按照Trinh, T.H发表在《自然》上的文章的说法，自1978年以来四十多年间，吴文俊先生的“吴”方法，一直是世界上最先进的几何定理机器证明方法，现在才被AlphaGeometry超越。

1/1 | 总计:1 | 首页 | 上一页 | 下一页 | 末页 | 跳转

返回顶部

王宏琳

扫一扫，分享此博文

spring63的个人博客分享 http://blog.sciencenet.cn/u/spring63

博文

人工智能的最新挑战：数学奥林匹克精选

当前推荐数：2 推荐人：彭真明 康建

该博文允许注册用户评论请点击登录评论 (1 个评论)

王宏琳

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

spring63的个人博客分享 http://blog.sciencenet.cn/u/spring63

博文

人工智能的最新挑战：数学奥林匹克 精选

当前推荐数：2 推荐人： 彭真明 康建

该博文允许注册用户评论 请点击登录 评论 (1 个评论)

王宏琳

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

人工智能的最新挑战：数学奥林匹克精选

当前推荐数：2 推荐人：彭真明康建

该博文允许注册用户评论请点击登录评论 (1 个评论)