姬扬的个人博客分享 http://blog.sciencenet.cn/u/jiyang1971

博文

千年未有之大变局:关于DeepMind团队AlphaGo的更多信息 精选

已有 11008 次阅读 2016-1-31 15:34 |个人分类:个人看法|系统分类:观点评述

PS:战胜樊麾的是Distributed AlphaGo,而不是单机版的AlphaGo??? 2016-02-05

城头变幻大王旗

 

2016年1月28日,Google公司DeepMind团队在Nature杂志上发表学术论文,介绍了人工智能的围棋程序AlphaGo的构建原理与具体实现,同时宣布AlphaGo在分先的公平对局条件下以5:0的成绩击败了职业棋手樊麾。这是人工智能领域了不起的成就。

我读了这篇Nature文章,也看了网上的很多评论。我的专业水平不足以做科普,我的围棋水平也不足以衡量AlphaGo的棋力。下面是关于AlphaGo的一些信息,比赛信息来自于Nature文章,其余来自于网上文章。

 

AlphaGo与樊麾的比赛:

1、2015年10月5-9日,连续五天比赛。五局胜负制,无论胜负如何,五局都要下完。

2、每天两盘棋,第一盘是正式比赛(慢棋,1小时加3次30秒的读秒),第二盘是非正式比赛(快棋,只有3次30秒的读秒)。

3、分先对局,采用中国围棋规则(黑棋贴7.5目)。

4、最后成绩只记录正式比赛结果。

5、比赛规则在比赛之前就已经确定,得到樊麾的认可。

6、AlphaGo在正式比赛(慢棋)中以5:0战胜樊麾。樊麾3次执黑(第一、三、五局);第一局AlphaGo执白2.5目胜樊麾,其余四局都是中盘胜。

7、AlphaGo在非正式比赛(快棋)中以3:2战胜樊麾。樊麾2次执黑(第一、三局);5盘都是中盘胜。

 

AlphaGo与其他电脑的比赛:

1、对手为CrazyStone、Zen、Pachi、Fuego、GnuGo,他们和AlphaGo一样,都是单机版。具体版本和棋力如下:AlphaGo(无),CrazyStone(2015,KGS 6d)、Zen(5, KGS 6d)、Pachi(10.99,KGS 2d)、Fuego(svn1989,无)、GnuGo(3.8,2k)。KGS大致相当于国内围棋网站如弈城、新浪、Tom等。

2、还有一个更强的对手,Distributed AlphaGo,即分布式的AlphaGo。

3、AlphaGo和Distributed AlphaGo的算法是相同的,差别在于硬件资源。AlphaGo有48个CPU和8个GPU,而Distributed AlphaGo有1202个CPU和176个GPU。作为比较,CrazyStone只有32个CPU,而Zen只有8个CPU。

4、AlphaGo慢棋5:0胜职业二段樊麾,快棋3:2胜樊麾。

5、电脑之间的比赛,每步棋最多5秒钟。

6、AlphaGo(单机版)比其他电脑强很多:495局比赛中,只输了1局;在与CrazyStone、Zen和Pachi的让四子对局中,AlphaGo的胜率分别是77%、86%和99%。

7、Distributed AlphaGo的棋力更强,他对单机版AlphaGo的胜率是77%,对其他电脑是100%。

 

关于电脑的棋力:

1、AlphaGo之前的电脑可以算是业余高手,CrazyStone和Zen都是KGS 6d,大致是弈城6d或者更好一些的水平,大概是业余5段的水平。

2、职业棋手对此前电脑(大致是Zen)棋力的评价:周俊勋和俞斌都说能让4-5子,罗洗河说能让9子。估计也应该有业5的水平。

3、职业棋手认为AlphaGo的棋力应该有职业水准,大致是顶尖棋手先二的水平。也就是说,顶尖棋手可以让先或者让二子。

4、AlphaGo对Zen的让四子对局,胜率为86%。Distributed AlphaGo的棋力更强,他对单机版AlphaGo的胜率是77%。

5、Nature文章估计,AlphaGo的棋力大致是职业二段(樊麾是职业二段,也是用来衡量棋力的标尺)。从文章给出的误差棒来看,樊麾的水平(误差棒)在1p-4p之间(也许是9d-5p,反正起伏很大就是了),而AlphaGo的水平很稳定,就是2p。Distributed AlphaGo的棋力大概是4-5p。

6、因为所有的对局都是去年10月之前的,AlphaGo现在的棋力应该是更强了。

7、已经公布的信息不足以推断AlphaGo的棋力,只知道他至少具有业余顶尖高手的棋力, 强于樊麾,弱于Distributed AlphaGo。(PS:战胜樊麾的是Distributed AlphaGo,而不是单机版的AlphaGo???)

 

关于AlphaGo与李世石的比赛:

1、比赛时间是今年3月,地点是韩国首都汉城。五局胜负制,无论胜负如何,五局都要下完。出战李世石的是AlphaGo而不是Distributed AlphaGo。

2、业余爱好者都看好李世石,职业棋手认为没问题,AI专家认为值得期望。柯洁(目前中国排名第一的棋手,也是现在世界最强的棋手)认为AlphaGo取胜的机会不到5%。

3、李世石是冠军数最多、人气最高、名声最大的现役棋手,他出来拿这100万美元的广告费是实至名归的。

4、当事人都谨慎乐观:李世石说要争取4:1或5:0;DeepMind团队很有信心,认为大致是五五开。

5、第一局比赛非常重要。对于李世石来说更是如此。

6、形势对李世石非常不利。“胜之不武,弗胜为笑”。李世石在明、AlphaGo在暗。AlphaGo知己知彼,而李世石知己而不知彼。AlphaGo肯定研究过李世石的所有棋谱,甚至与李世石交过手的棋手的所有棋谱;AlphaGo的有效棋谱只有5-10盘,甚至连这几盘棋谱也谈不上有效,因为这些棋谱显示不了他的真实棋力,只能说明他比樊麾二段强。不知道比赛协议里有没有说在比赛前给李世石提供足够的棋谱,即使提供了李世石也很难得到多少有效信息。

7、我看好李世石,我认为至少是七三开(前几天我认为是九一)。我认为AlphaGo和李世石应该都能赢至少一盘棋。李世石应该是4:1拿下比赛。如果直落三局的话,有可能是3:2.

 

山雨欲来风满楼

 

 

附录一: 学术论文

google公司DeepMind团队

Mastering the game of Go with deep neural networks and tree search

David Silver, Aja Huang, ......, Demis Hassabis

A computer Go program based on deep neural networks defeats a human professional player to achieve one of the grand challenges of artificial intelligence.

Nature  529, 484489 (28 January 2016) doi:10.1038/nature16961 Received  11 November 2015  Accepted  05 January 2016  Published online  27 January 2016

 

Facebook公司(田渊栋Yan Zhu

Better Computer Go Player with Neural Network and Long-term Prediction

Yuandong Tian, Yan Zhu

(Submitted on 19 Nov 2015 (v1), last revised 26 Jan 2016 (this version, v2))

http://arxiv.org/abs/1511.06410  

 

附录二: 棋界反响

新浪专题: 围棋人工智能来袭

http://sports.sina.com.cn/zt_d/deepmindalphago  

 

人工智能5-0欧洲冠军 李世石将捍卫人类尊严

http://sports.sina.com.cn/go/2016-01-28/doc-ifxnzanh0180135.shtml  

 

李世石:请人类支持我 争取不让电脑赢到2

http://sports.sina.com.cn/go/2016-01-30/doc-ifxnzanh0405068.shtml  

 

世界冠军谈谷歌围棋:人类应放下自己的骄傲

http://sports.sina.com.cn/go/2016-01-30/doc-ifxnzanh0397466.shtml  

 

樊麾裁判设计者专家谈谷歌围棋 或战胜李世石

http://sports.sina.com.cn/go/2016-01-30/doc-ifxnzanm3838179.shtml  

 文章来源:环球科学

 

附录三:知乎科普

如何看待Google围棋 AI AlphaGo 击败欧洲围棋冠军?

https://www.zhihu.com/question/39905662  

 

 

田渊栋,卡耐基梅隆大学机器人系博士,Facebook人工智能组研究员

https://www.zhihu.com/people/tian-yuan-dong  

 

附录四:我的看法

1、棋力很难从棋谱上估计出来的。终究是盘上见胜负,旁观者很难看出来的。就像日本人当年评价中国的古棋,有说黄龙士中盘十三段的,也有说范施不过业6的,但是也有人说公道话:不到棋盘上下一下,谁也不知道他到底有多强。对林海峰的评价也类似:林先生的棋看起来一点也不厉害,可是你坐到棋盘对面,就能感觉到他的力量了。

2、我看了第一局樊麾(黑)对AlphaGo的棋谱。 白136,居然在围中腹,俨然宇宙流的架势。 通盘没有劫争,没有转换,不知道为什么。按理说,他们这种棋手,劫争、转换是必然的啊。 眼看着要输棋,也不用胜负手,就这么输掉了, 太奇怪了。难道AlphaGo的形势判断、局面控制能力都非常强?劫争、转换、惩罚无理手,无论哪个都很强?按说不应该啊。一众职业棋手说他是先二的水平,未免太托大了。 就算是柯洁对阵樊麾,也没有横扫五蛋的把握吧?

3、刚看了AlphaGo对战李世石的新闻发布会,DeepMind信心满满,自认为胜负五五开。不知道他们为什么这么牛,难道对樊没有出全力?

4、要跟AlphaGo对局,必须进行战斗,铺地板肯定是不行的,一定要做劫、转换。李昌镐上场也不一定必胜,因为他的看家本领是不出错;老聂上场估计不行,因为他虽然前五十步天下第一,但是后半盘的漏招太多;曹燕子、古大力之类的上去,估计收拾AlphaGo就像收拾菜一样,说不定摆上两子都能赢。所以说,这次比赛,李世石必胜!

5、期待三月的对局,我相信李世石会赢。他肯定会做战、纠缠、劫争、转换,希望电脑能拿下一局,要是成了黔之驴的话,就太无趣了。

6、好在很快就要和李世石比赛了。是骡子是马,拉出来遛遛。我觉得李世石肯定能拿下来,但是,围棋能坚持几年呢?也许五年,也许十年,但绝对不是遥遥无期了。

 

有感于DeepMind击败围棋职业选手  

http://blog.sciencenet.cn/blog-1319915-953005.html  

 

围棋之幸与不幸

http://blog.sciencenet.cn/blog-1319915-953081.html  

 

关于AlphaGo战胜职业棋手的一些评论

http://blog.sciencenet.cn/home.php?mod=space&uid=1319915&do=blog&id=953190  


千年未有之大变局:关于DeepMind团队AlphaGo的更多信息

http://blog.sciencenet.cn/blog-1319915-953678.html


 

 

千年未有之大变局,我们适逢其会了。

 

 

 

PS:

居然置顶了。那就补充一些信息。

现在网络上对这件事情的讨论很多、很热烈,但是坦率地说,价值并不大——因为绝大部分都是事后诸葛亮。

另外几个就是当事人了:DeepMind信心十足,当然你可以认为他是在给自己打气;樊麾认为对手非常强大,当然你可以认为他是在给自己的失败找借口;李世石认为自己肯定赢,但是他没有任何对手的有效信息,AlphaGo和樊麾的那几盘棋能够告诉李的信息量基本为零。

我只见到一个局外人预见到了这件事情。2014年底,他就认为现有技术已经可以使得电脑在围棋上战胜人类了。

所以,他的意见是值得考虑的——他认为,这次李世石很可能会输的。



马骏 编辑于 2016-01-29
https://www.zhihu.com/question/39906815/answer/83954700  

立个FLAG,能战胜。
虽然AlphaGO和樊麾比赛的时候,棋力是弱职业选手水平,但已经证明这条路走对了(更重要的是,终于有大公司投钱搞围棋AI了),接下来提高水平只是时间问题。
虽然从去年10月到今年3月,AlphaGO是否已经进步了足够多能够战胜李世石,我也没有100%的把握,但这不重要。是今年3月超过,还是再过几个月超过,长期来看无关紧要,重要的是在不远的将来,AI和人类围棋水平的差距,必将达到赛跑水平的差距。所以我这次先大胆投给AlphaGO了。
附一个我2014年立的FLAG,当时大家对围棋AI的前景还很悲观:
围棋作为唯一一种电脑下不赢人的大众棋类,是何原因导致?以及量子计算机出现后有无可能? - 马骏的回答

马骏  发布于 2014-12-23 :
https://www.zhihu.com/question/27169866/answer/35693685  
以目前的硬件水平,已经足以在围棋上击败人类了,根本没量子计算机什么事。目前下不过人类,只是因为没人去研究围棋算法,毕竟在欧美不够流行。
http://www.ifanr.com/476606  
这个新闻里的算法是非常非常粗糙的,训练集也很小,就已经有很好的效果了。只要有人愿意出钱研究,战胜职业棋手只是时间问题。


 


 

 




世纪人机大战:李世石 VS AlphaGo
http://blog.sciencenet.cn/blog-1319915-953678.html

上一篇:关于AlphaGo战胜职业棋手的一些评论
下一篇:功夫熊猫3 很好看

23 尤明庆 刘全慧 武夷山 徐令予 李竞 王毅翔 黄永义 文克玲 李颖业 汤奔阳 田云川 马志超 谢力 宁利中 杨正瓴 秦承志 dulizhi95 tuner yangb919 xiyouxiyou taoshl ssmmachen mxt110

该博文允许注册用户评论 请点击登录 评论 (47 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2020-12-1 07:20

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部