博文

阿发狗陷入迷阵后的人性

已有 5228 次阅读 2016-3-14 08:40 |个人分类:计算|系统分类:观点评述

人机大战第四局，李世石执白，稳打稳扎，获得不少实地。但黑上面围成大空。李如果不能对其进行破空，局势危殆。

吴清源说，下棋就会犯错误，连续下棋就会连续犯错误。

但阿发狗是很少犯错误的，它靠不断积累小的优势成为大的优势。就像2%的利息，40年后也翻倍了。

阿发狗40步之后，优势明显。人类棋手不出奇招，很难取胜。

棋下到此处，黑棋看起来相当坚固，似乎无懈可击，包围圈中的白子似乎无路可逃。

李陷入长考，然后走出上图中的挖。

须知，李长考的时候，阿发狗也是在进行高速计算的。但李这一招出乎所有其他人的意料以及阿发狗的计算。

如果我没猜错，这是因为阿发狗的计算先得根据所谓”对策网络”（policy network)挑选可能的步骤，然后再用价值网络详细推演。

如果这一步棋没有先被“对策网络”识别，那么很容易出现失算。

这步挖初看似乎是无理之着，细看才发现与左边黑的弱点呼应，暗藏杀机。正所谓更喜岷山千里雪，三军过后尽开颜。

之后，阿发狗的应对似乎一度乱了方寸。。。走出不少局部亏损的招数，而且也频频陷入长考。

最终，阿发狗颇有风度地中盘认输（据说是计算出胜利几率小于10%）。

阿发狗这个中盘认输的风度，a machine programmed with humanity，让我想起了《T2》中最后一个场景。

(相比之下，网上下围棋很多人明明输了，却要不断填子，等你不慎失误。。。）

难得的笑容

相关专题：世纪人机大战：李世石 VS AlphaGo
转载本文请联系原作者获取授权，同时请注明本文来自岳东晓科学网博客。
链接地址：https://blog.sciencenet.cn/blog-684007-962491.html

上一篇：人机较量最大的差距是心理素质
下一篇：GPS与相对论之指点迷津