||
[敬请读者注意] 本人保留本文的全部著作权利。如果哪位读者使用本文所描述内容,请务必如实引用并明白注明本文出处。如果本人发现任何人擅自使用本文任何部分内容而不明白注明出处,恕本人在网上广泛公布侵权者姓名。敬请各位读者注意,谢谢!
Google AlphaGo 和李世石之战:为何说李世石凶多吉少?
程京德
前一篇随笔中,本人提到,“那么,3月份的 AlphaGo 和李世石之战,对李世石来说就凶多吉少了”。有熟人、朋友、学生、网友问“为何?”,问题的典型提法是,“许多顶级职业棋手看了 AlphaGo 和樊麾之战的棋谱后,都不看好 AlphaGo ,你凭什么说李世石凶多吉少?” 而本人对此类问题都先反问,“你看见我那句话中“那么”两个字的前面说了什么没有?” 我自己的感觉是,要么是有疑问的人没有好好阅读和理解我在结论前面已经提及的前提条件,要么是我提及的前提条件太抽象太专业使得非计算机专业人士很难理解到问题的本质(蛇足一句,如果一个计算机专业人士也理解不了,那么就有点“不专业”了啊,呵呵)。故而专门撰写本文,尽可能具体地通俗地做更详细解释。
在前一篇随笔“Google AlphaGo 战胜职业围棋手究竟还蕴涵着哪些有趣的问题?”中,本人的原话如下:“如果 AlphaGo 的确具备了系统的、一般的自学习、自评价、自我成长能力,并且樊麾和李世石的棋力之间仅仅是经验之差而没有本质上飞跃性差距的话,那么,3月份的 AlphaGo 和李世石之战,对李世石来说就凶多吉少了。这是因为, AlphaGo 棋力的提高仅仅是个训练数据和时间的问题,从去年10月战胜樊麾到今年3月,让 AlphaGo 训练和学习的时间已经足够了。或者说,即便是此次交战李世石能够勉强获胜, AlphaGo 战胜人类超一流旗手也是指日可待的事情了。”
这里,对“3月份的 AlphaGo 和李世石之战,对李世石来说就凶多吉少”这个基于猜想的结论,有三个重要的前提条件:(1) AlphaGo 的确具备了自学习、自评价、自我成长能力;(2) AlphaGo 的自学习、自评价、自我成长能力是具有系统性、一般性的;(3)樊麾和李世石的棋力之间仅仅是经验之差而没有本质上飞跃性差距。
让计算机程序真正具备“自评价、自我成长能力”是一件很难的事情(所以本人在随笔“Google AlphaGo 战胜职业围棋手究竟意味着什么?”中评价 AlphaGo 的自学习、自评价、自我成长能力是里程碑性质的成就),难就难在评价标准的设定和修改上。而一旦一个计算机程序具备了自学习、自评价、自我成长能力,那么就意味着它可以在评价标准适用范围内,凭借现代计算机的快速计算能力(远远超出于人类),让自己很快地成长到最佳水平。从 DeepMind 团队关于 AlphaGo 的论文以及 AlphaGo 完胜樊麾的对战实验来看,程度和理论根据另论, AlphaGo 似乎的确已经具备了自学习、自评价、自我成长能力。
让计算机程序的自学习、自评价、自我成长能力具有系统性、一般性是一件更难的事情。这里,系统性是指,该计算机程序的行为是确定的、有秩序而按部就班的、可系统地重复的,不是随机地“撞大运”的。一般性是指,该计算机程序所能计算、解决的问题是一个整类而并非仅仅针对于单一的一个。实话实说,对 AlphaGo 的自学习、自评价、自我成长能力是否可以说是真正具有系统性和一般性,笔者本人也还抱有疑问,因为 DeepMind 团队的论文中丝毫没有提供(实际上大概是不可能提供)这方面的证据。所以,本人认为,3月份的 AlphaGo 和李世石之战,是测试 AlphaGo 是否真正具备系统性和一般性的试金石。顺便说一句,当年战胜世界冠军、国际象棋特级大师 Kasparov 的 Deep Bule ,就是一个没有系统性和一般性的、Ad hoc 的、完全是针对于 Kasparov 的系统( IBM 团队甚至拒绝了 Kasparov 的再挑战要求,但是这并不妨碍 Deep Bule 成为一个里程碑系统)。
笔者本人的围棋水平还是当年插队、读书年代的入门水平,完全没有知识和能力判断樊麾和李世石的棋力之间是否仅仅是经验之差而有无本质上飞跃性差距,所以,将此设为第三个前提条件。但是,本人认为,只要 AlphaGo 的确已经具备了自学习、自评价、自我成长能力,那么,用李世石的棋谱来训练它,让它和李世石持续对战的话,完胜李世石就是个时间问题,毫无悬念。不以李世石为对手,换另一个世界顶级超一流棋手来,也是同样(本人真是很难理解某些世界顶级棋手根本不把 AlphaGo 放在眼里的大话,大概是源于无知的无畏吧,呵呵)。
一般地说,现在我们使用着的电子数字通用计算机,其唯一胜过我们人类的能力就是高速计算能力。理论上基于经典数理逻辑的电子数字通用计算机,其自身不会,也永远不可能会做因果推理、逻辑推理。DeepMind 团队的成功在于他们开发出作为计算机程序的 AlphaGo 系统,让 AlphaGo 去做自学习、自评价、自我成长的高速计算,这本质上是“人类智能”之“智”的成功而非所谓“机器智能”之“快”的成功。醉翁之意不在酒。实际上,笔者这组随笔的根本之意,是要给霍金、马斯克们的追随者们打打预防针,请他们不要因此 AlphaGo 完胜樊麾事件而过于乐观,以此事件作为支持根据来继续宣扬“人工智能威胁人类”的谬论。
最后,对什么是“计算机”、什么是“计算”还不十分了解的非计算机专业读者,想要完全理解本文的内容,还烦请阅读一下本人以前有关“计算机”和“计算”的科普博文。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 16:38
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社