yuedongxiao的个人博客分享 http://blog.sciencenet.cn/u/yuedongxiao

博文

阿发狗陷入迷阵后的人性

已有 5228 次阅读 2016-3-14 08:40 |个人分类:计算|系统分类:观点评述

人机大战第四局,李世石执白,稳打稳扎,获得不少实地。但黑上面围成大空。李如果不能对其进行破空,局势危殆。

吴清源说,下棋就会犯错误,连续下棋就会连续犯错误。

但阿发狗是很少犯错误的,它靠不断积累小的优势成为大的优势。就像2%的利息,40年后也翻倍了。
阿发狗40步之后,优势明显。人类棋手不出奇招,很难取胜。

nIqg-fxqhwtu7712125.jpg

棋下到此处,黑棋看起来相当坚固,似乎无懈可击,包围圈中的白子似乎无路可逃。

李陷入长考,然后走出上图中的挖。

须知,李长考的时候,阿发狗也是在进行高速计算的。但李这一招出乎所有其他人的意料以及阿发狗的计算。
如果我没猜错,这是因为阿发狗的计算先得根据所谓”对策网络”(policy network)挑选可能的步骤,然后再用价值网络详细推演。
如果这一步棋没有先被“对策网络”识别,那么很容易出现失算。
这步挖初看似乎是无理之着,细看才发现与左边黑的弱点呼应,暗藏杀机。正所谓更喜岷山千里雪,三军过后尽开颜。

之后,阿发狗的应对似乎一度乱了方寸。。。走出不少局部亏损的招数,而且也频频陷入长考。

最终,阿发狗颇有风度地中盘认输 (据说是计算出胜利几率小于10%)。

阿发狗这个中盘认输的风度,a machine programmed with humanity, 让我想起了《T2》中最后一个场景。

(相比之下,网上下围棋很多人明明输了,却要不断填子,等你不慎失误。。。



难得的笑容


棋谱参见:http://www.zhenzhubay.com/blog-1-32066.html



世纪人机大战:李世石 VS AlphaGo
https://blog.sciencenet.cn/blog-684007-962491.html

上一篇:人机较量最大的差距是心理素质
下一篇:GPS与相对论之指点迷津
收藏 IP: 24.7.123.*| 热度|

4 赵建民 魏焱明 宁利中 yangb919

该博文允许注册用户评论 请点击登录 评论 (1 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-27 03:28

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部