程京德(Jingde Cheng)的博 ...分享 http://blog.sciencenet.cn/u/JingdeCheng 相关逻辑,软件工程,知识工程,信息安全性工程;自强不息,厚德载物。

博文

人类围棋高手现在还能够和AlphaGo“玩”什么? 精选

已有 9259 次阅读 2017-1-5 08:47 |个人分类:人工智能|系统分类:科研笔记

[敬请读者注意] 本人保留本文的全部著作权利。如果哪位读者使用本文所描述内容,请务必如实引用并明白注明本文出处。如果本人发现任何人擅自使用本文任何部分内容而不明白注明出处,恕本人在网上广泛公布侵权者姓名。敬请各位读者注意,谢谢!


人类围棋高手现在还能够和AlphaGo“玩”什么?

程京德


Google DeepMind 的计算机围棋程序 AlphaGo 网上与所有当今人类职业围棋高手对弈,连胜60局,横扫了所有的对手,居然没有输一盘棋!诸位职业围棋高手这次似乎输的心服口服,远没有去年2月份时的“源于无知的无畏”(Google AlphaGo 和李世石之战:为何说李世石凶多吉少?http://blog.sciencenet.cn/blog-2371919-955215.html)了。据说,这次的网上对弈仅仅是非正式测试,接下来 DeepMind 团队还会用 AlphaGo 和职业围棋高手们进行正式的比赛。实际上,仅从比胜负的角度来说,正式比赛已经毫无悬念了,网上已经有评论说,李世石年3月份赢 AlphaGo 的那盘棋,就是人类赢的最后一盘棋。

AlphaGo 此次面对众多人类职业围棋高手们的表现,已经足以说明了 DeepMind 团队开发的计算机围棋程序和所借用的计算机计算能力的威力(再次强调一遍,这完全不是什么“机器的胜利”或者“机器的智能的胜利”,而是人类智能借助了计算机高速计算能力的胜利!)。从人工智能学术研究或者围棋机理研究的角度出发,接下来,人类还应该怎么和 AlphaGo “玩”,怎样和 AlphaGo “玩”呢?

如果 DeepMind 团队不公布 AlphaGo 的细节,继续让 AlphaGo 作为黑盒子和人类棋手对弈,那么,至少有两种玩法还是有可能的:一,人类棋手允许 AlphaGo 让子;二,扩大围棋棋盘。

让子,是在人类围棋棋手之间常用的一种做法,其本质不在输赢,而在于提供了一种判断棋手棋力高低的标准。既然现在人类职业围棋高手们已经输的心服口服,那么就不妨干脆放下架子,允许 AlphaGo 让子,并且不限制于让到几子为止,而是让到可以战胜 AlphaGo 的子数为止。这样“玩法”的有趣之处在于,一,发现 AlphaGo 的终极棋力,因为如果允许无限制让子,最终“胜者”必然是人类棋手而非计算机围棋程序。二,可以借用 AlphaGo 的棋力来作为判断棋手棋力高低的客观标准,因为即便同是人类世界顶级高手,棋力终究还是有微小差距的,以 AlphaGo 的棋力作为唯一的衡量标准,或许能够衡量出人类职业围棋高手在棋力(允许 AlphaGo 的让子数)上的微小差距。一个非常明显的事实是,由于借助于计算机的高速计算能力, AlphaGo 的棋力增长速度远远超过人类围棋棋手。实际上,人类世界顶级高手的棋力已经是很难增长的了。但是,即便是开发 AlphaGo 的 DeepMind 团队,恐怕也无人清楚地知道 AlphaGo 的棋力究竟有多么强。所以,以让子方式的对弈来发现计算机围棋程序的终极棋力以及给出衡量人类棋手之间棋力差距的客观标准,应该不失为一种有意义的尝试。

扩大围棋棋盘,是年2月份笔者预测到李世石可能会输给 AlphaGo 时就提出过的“玩法”:“到了 AlphaGo 战胜超一流棋手的那一天,我们仍然可以继续让它来挑战人类智能:把围棋盘扩大到21*21, 23*23, 25*25, ……。让职业棋手的直觉和经验与 AlphaGo 在双方都没有棋谱可利用的条件下出发来比个高低,不是也很有趣吗?”(Google AlphaGo 战胜职业围棋手究竟还蕴涵着哪些有趣的问题?http://blog.sciencenet.cn/blog-2371919-953785.html)。笔者从直觉上认为,扩大围棋棋盘对于基于直觉和经验的人类职业围棋高手的影响,也许比对基于计算和训练数据的 AlphaGo 的影响要来的小一些。实际上,既然 AlphaGo 程序已经做到了层次化的自动化,那么,它剩下的弱点就只有计算复杂性和输入数据了。从利用以人类智能开发出的计算机围棋程序并且借助了计算机高速计算能力来挑战围棋对弈中世界顶级高手这场对战来看,的确可以说结果已经是明白的了。但是,从人工智能科学实验的角度来看,扩大围棋棋盘的对弈,应该是可以作为一种实验手段的吧。这样的实验,不应该是让 AlphaGo 先行训练好了再来和人类棋手对弈,应该是双方都从零开始,由人类棋手轮番与 AlphaGo 对弈才有趣,因为这样我们就可以具体观察到 AlphaGo 的棋力增强过程。

另一方面,如果 DeepMind 团队公布 AlphaGo 的细节,那么研究工作者和职业围棋高手的“玩法”就更多,更有趣,更具有挑战性了,关于怎样“玩”,暂且留作今后的话题吧。

无论如何,从争胜负来说,计算机围棋程序与人类围棋高手之间的胜负已定,这一幕应该已经算是结束了。接下来的有趣工作是:我们如何才能说清楚 AlphaGo 的机理?我们如何利用 AlphaGo 来探索围棋世界里还没有从理论上弄清楚的众多问题的答案?如果我们仅把目光聚集在胜负上,似乎是很不够的。




世纪人机大战:李世石 VS AlphaGo
https://blog.sciencenet.cn/blog-2371919-1025505.html

上一篇:哥德尔不完全性定理的内容和有效范围 (2) 哥德尔并没有断定什么
下一篇:AlphaGo完胜人类围棋高手并不能证实什么?
收藏 IP: 219.111.183.*| 热度|

13 杨正瓴 岳雷 黄永义 蒋永华 金拓 郑俊 李学宽 高友鹤 qx12 xlsd biofans unet happyandwin

该博文允许注册用户评论 请点击登录 评论 (52 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-3-28 23:38

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部