ycgvbst的个人博客分享 http://blog.sciencenet.cn/u/ycgvbst

博文

是机器战胜了人类吗——写在李世石三败AlphaGo之后 精选

已有 5785 次阅读 2016-3-12 20:47 |系统分类:观点评述

今天时间很充裕,早早地就在电脑前面坐着,还一时兴起写了一个前瞻和预测,http://blog.sciencenet.cn/blog-2997863-962175.html

整个一局看下来,还是为李世石感到无奈。


一、局面的简单介绍

三局下来,人们不断地修正着对AlphaGo的认识。

第一局下完时,有专家这样来解释AlphaGo在居中的几手昏招:因为AlphaGo一直对棋局的评估是自己略占优势,所以,下出了几手昏招。专家们普遍认为:AlphaGo的局部战力很强,但大局意识离人类的能力还差的很远。

第二局下完时,有专家有总结说:AlphaGo的下法刻意地避免打劫,且根本就不应劫,或者不给李世石造成打劫的劫材。专家推测原因是AlphaGo无法评估多处劫材所引起的混乱局面。

今天,第三局下完了,在中后盘下部的劫战不禁让人大饱眼福,且一举击破了AlphaGo不会打劫的传言。更要命的是,AlphaGo还会在真正劫战之前把劫材周围的各种补丁打好,而不是急于打劫,活脱脱棋圣吴清源的曲风。

明天的第四局呢?我们会怎么看?

第五局呢?

五年之后呢?五十年之后呢?


二、AlphaGo到底厉害在哪里?

先说一下AlphaGo到底为什么这么厉害?

其实,AlphaGo之所以这么厉害,还主要在于其内里的算法——价值网络与蒙特卡洛树形搜索(MCTS)。AlphaGo的价值网络与蒙特卡洛树形搜索(MCTS)的作用在哪里?且听我啰嗦几句。

首先,早就有人解密,我们也必须要知道,它的作用机制并不是寻找全局最优,因为那样既导致搜索深度的无限增加,也会导致时间耗费殆尽。

它的原理是在自己所存储的棋谱库中搜寻职业棋手的走法,但在之前对所存储的棋谱库进行数据分析和数据挖掘的时候,已经对职业棋手常用的打法赋予了相应的权值,这个权值就是所谓的价值网络,用以评估某一步走法所导致的最后结果以及这一打法在结局中所其的作用。因此,AlphaGo并不是完全深度搜索和广度搜索来评判,而是根据某一步的价值来进行判断。

更进一步的,AlphaGo的另外一个做法就是能够尽量地避免以前所有出现过的败手,采用最有价值和最有优势的下法。但提醒大家特别注意的是,这个是一个伪全局最优。AlphaGo一定是只评判了整个棋盘的某一部分的形。

拿第一局对弈的白80手来说,被现场解说的古力认为是一大缓招。从当时的棋局看白80竟然导致了黑79和黑81 弄成了一个著名的双飞燕,不论后手如何,在职业棋手的对弈来说,如果出现这种情况,棋手即便不自废武功,也会被逐出师门。但AlphaGo就不紧不慢地来一步白80,你且做你的双飞燕吧。

我在猜测有两个原因:一个是AlphaGo的棋谱库中双飞燕太少了,因此AlphaGo的价值网络中根本就没有双飞燕的样本,因为职业棋手很少让人下成双飞燕的走势。另外一个就是对于左下角黑棋可能的双飞燕来说,左上的白棋形式和形势都很好,如果让黑棋在白80位出头的话,不仅对左上白棋构成威胁,而且还与中腹部的黑棋联络起来,右侧的白棋4字瞬间陷入虎口,孰好孰坏,AlphaGo认为还是捞取实地和眼下最为要紧吧。

上图为第一局对弈的对局图


再说今天这第三局,这一局李世石可是充分利用了劫材。

但,遗憾的是,因为计算力远远弱于AlphaGo,所制造的劫材实在太少,即便是有,价值也远远小于AlphaGo构造的劫材,因此,在下部纠缠了一会后,李世石便投子认负了。

这说明,AlphaGo根本不怕劫,原因不是AlphaGo不怕劫,而是AlphaGo不怕计算,因为,劫的制造和运用是要靠周围的棋力做支撑的,而这些又离不开上述所说的算法和计算。也没见过谁一上来什么都不管,接二连三地虎下去的。还别说,搞不准我这样随口一说可以算作李世石赢取一场比赛的奇招呢?要是那样,就算李世石赢了,恐怕也要被全世界围棋手的唾沫淹死了:还有一点9段棋手的样子吗?完全就是流氓了!但,毕竟能为人类赢一场,不是吗?

 

三、为什么是围棋?AlphaGo懂得围棋的哲学吗?

围棋一直被称作人类保卫自己智商和思维的高地之一,也是到截止到昨天为止尚未被计算机攻陷的高智力游戏之一。按照五局三胜制,今天李世石已经输掉了整场比赛,只不过因为一纸合约,还要把戏演完。

众所周知,围棋是讲究形和势的。但意味深长的是,最终要用地来评判胜负。经常听到讲局的一流高手说:这个棋形下成这样,恐怕黑(白)棋已经无能为力了。也经常听到某高人解说道:这几步黑(白)棋的势非常好。

当然,形和势上的优势可以转化为实地,这也是高手都要追求形和势的道理。

高手往往看不起一味只知道追求局部实地的做法,并一贯地对之不屑着。

可笑的是,AlphaGo用三场酣畅淋漓的大胜告诉我们人类追求大模样的形和势就是地地道道的装逼。

想想第一局里面令人瞠目结舌的黑棋双飞燕,以及刚刚解释过的白80,一个追求大势,一个追求实地,结局怎么差那么多呢?

从这个角度,你可以认为人类要比AlphaGo更加懂得围棋的道理、哲学和内涵,而AlphaGo根本不懂得势,不懂得围棋的哲学。

但别忘了,哲学最讲究的就是变化,不光有质量互变,还有否定之否定呢。

难道实地取多了之后不会积攒成势吗?焉知AlphaGo不是这样思考的?




世纪人机大战:李世石 VS AlphaGo
https://blog.sciencenet.cn/blog-2997863-962246.html

上一篇:写在alphaGo和李世石第三次大战之前
下一篇:上班“奇遇”记
收藏 IP: 111.224.232.*| 热度|

11 刘洋 柏舟 应行仁 徐令予 姬扬 田云川 peosim yangb919 liuhaoa1234 xlianggg shenlu

该博文允许注册用户评论 请点击登录 评论 (15 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-7-18 15:33

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部