spring63的个人博客分享 http://blog.sciencenet.cn/u/spring63

博文

人工智能的最新挑战:数学奥林匹克 精选

已有 4840 次阅读 2024-1-23 07:18 |个人分类:科技资讯|系统分类:海外观察

谷歌DeepMind解复杂几何问题的人工智能系统,展现了人工智能不断增长的逻辑推理能力,以及发现和验证新知识的能力在过去几天中,从《纽约时报》到《麻省理工学院科技评论》网站诸多海外媒体,对此均有所报导。专家说,这是向具有更像人类的推理技能的机器,迈出重要一步。

2024年117谷歌DeepMind和纽约大学的一个团队,在《自然》杂志上发布了一个新人工智能系统,名为AlphaGeometry现在是谷歌DeepMind系列人工智能系统的一部分)。该系统是一个神经符号系统,由一个神经语言模型和一个符号推理引擎组成,它们一起工作来寻找复杂几何定理的证明。语言模型提供快速的“直觉”想法,符号推理引擎提供更深思熟虑的理性决策。

解数学问题需要逻辑推理,这是目前大多数人工智能模型不擅长的。语言模型擅长识别模式和预测流程中的后续步骤,然而,其推理缺乏数学解题所需的严谨性。另一方面,符号引擎纯粹基于形式逻辑和严格的规则,这使它能够引导语言模型走向理性决策。

这两种方法分别负责创造性思维和逻辑推理,共同解数学难题。这非常类似于人类解几何问题的方式,将他们现有的理解与探索性实验相结合。

AlphaGeometry解国际数学奥林匹克竞赛(IMO)的几何问题,其水平几乎与人类金牌得主相当IMO可能是国际高中生最负盛名的竞赛。每年来自世界各地的学生争夺令人垂涎的铜牌、银牌和金牌(2023年有112个国家参加)。新的趋势是,人工智能程序可能很快也会参与竞争。

在对2000年至2022年的30个奥林匹克几何问题的测试测试集称为IMO-AG-30中,AlphaGeometry在时限内解了25个问题,而同期人类牌得主的平均解22.9个问题,金牌得主平均解25.9个问题。也就是说,AlphaGeometry超越了人类牌得主接近于人类金牌得主

国际数学奥林匹克竞赛这个年轻人才竞技场,而且已经成为数学和推理领域先进人工智能系统的试验场。此前最先进系统称为吴方法(Wu's method”),由中国数学家吴文俊1978年开发的,完成了10个问题。

image.png 

1 AlphaGeometry将几何定理证明器从低于人类水平提升到接近金牌得主的水平(参考资料[2]

当遇到几何问题时,AlphaGeometry首先尝试使用其符号引擎生成一个由逻辑驱动的证明。如果仅使用符号引擎无法做到这一点,语言模型会在图中添加一个新的点或线。这为符号引擎继续寻找证据提供了额外的可能性。这个循环继续下去,语言模型添加有用的元素,符号引擎测试新的证明策略,直到找到一个可验证的解方案。

图2摘编自参考资料[2],概述了AlphaGeometry如何解一个简单的问题。a简单的例子及其图bAlphaGeometry通过运行符号演绎引擎来启动证明搜索。引擎从定理前提中穷尽性地推导出新陈述(statements),直到定理被证明或新陈述被穷尽。c因为符号引擎未能找到证明,所以语言模型构造一个辅助点,在符号引擎重试之前增长证明状态。循环继续,直到找到解方案。d对于简单的例子,循环在第一个辅助结构“D作为BC的中点之后终止。证明包含另外两个步骤,这两个步骤都利用了中点属性“BD = DC”“BDC共线图中用蓝色突出显示。

image.png 

2 神经符号AlphaGeometry如何解一个简单的问题(参考资料[2]

为了训练AlphaGeometry的语言模型,研究人员创建自己的训练数据来弥补现有几何数据的不足。他们生成了近5亿个随机几何图,并将其输入符号引擎。该引擎分析每个图并生成关于其属性的陈述。这些陈述被组织成1亿个合成证明来训练语言模型。

[结语]

AlphaGeometry(解复杂的几何问题),代表了人工智能推理的突破。

以前的人工智能系统通常难以完成解复杂的几何问题所需的数学推理。

有专家称,除了数学之外,AlphaGeometry的影响还跨越了依赖几何问题解的各个领域,例如计算机视觉、建筑,甚至理论物理。然而,也有专家指出,仍有改进的余地。尽管AlphaGeometry可以解高中数学中的问题,但它还无法解大学教授的各种高级抽象问题。

DeepMind的新几何求解软件结合了两种不同的人工智能方法,这种混合方法可能有望解决其他领域的挑战 ——从物理学到金融 ——这些领域也需要明确的规则和更直观的方法来应用这些规则来解决问题。该软件的一个组件是神经网络,是该技术最近重大进步的主要原因。另一个组件是一个符号人工智能引擎,它使用一系列人类编码的规则来将数据表示为符号,然后操纵这些符号进行推理。在基于神经网络的深度学习在21世纪00年代中期开始迅速发展之前,从20世纪50年代到21世纪初的几十年里,符号人工智能曾经是一种流行的人工智能方法。

参考资料

[1] June Kimarchive page. Google DeepMind's new AI system can solve complex geometry problems.MIT Technology Review. January 17, 2024

https://www.technologyreview.com/2024/01/17/1086722/google-deepmind-alphageometry/

[2] Trinh, T.H., Wu, Y., Le, Q.V. et al. Solving olympiad geometry without human demonstrations. Nature 625, 476482 (2024).



https://blog.sciencenet.cn/blog-3005681-1418993.html

上一篇:2023年回顾:生成式人工智能
下一篇:漫谈平面镜反射
收藏 IP: 219.142.27.*| 热度|

2 彭真明 康建

该博文允许注册用户评论 请点击登录 评论 (1 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-23 22:42

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部