姬扬的个人博客分享 http://blog.sciencenet.cn/u/jiyang1971

博文

千年未有之大变局:关于DeepMind团队AlphaGo的更多信息 精选

已有 13082 次阅读 2016-1-31 15:34 |个人分类:个人看法|系统分类:观点评述

PS:战胜樊麾的是Distributed AlphaGo,而不是单机版的AlphaGo??? 2016-02-05

城头变幻大王旗

 

2016年1月28日,Google公司DeepMind团队在Nature杂志上发表学术论文,介绍了人工智能的围棋程序AlphaGo的构建原理与具体实现,同时宣布AlphaGo在分先的公平对局条件下以5:0的成绩击败了职业棋手樊麾。这是人工智能领域了不起的成就。

我读了这篇Nature文章,也看了网上的很多评论。我的专业水平不足以做科普,我的围棋水平也不足以衡量AlphaGo的棋力。下面是关于AlphaGo的一些信息,比赛信息来自于Nature文章,其余来自于网上文章。

 

AlphaGo与樊麾的比赛:

1、2015年10月5-9日,连续五天比赛。五局胜负制,无论胜负如何,五局都要下完。

2、每天两盘棋,第一盘是正式比赛(慢棋,1小时加3次30秒的读秒),第二盘是非正式比赛(快棋,只有3次30秒的读秒)。

3、分先对局,采用中国围棋规则(黑棋贴7.5目)。

4、最后成绩只记录正式比赛结果。

5、比赛规则在比赛之前就已经确定,得到樊麾的认可。

6、AlphaGo在正式比赛(慢棋)中以5:0战胜樊麾。樊麾3次执黑(第一、三、五局);第一局AlphaGo执白2.5目胜樊麾,其余四局都是中盘胜。

7、AlphaGo在非正式比赛(快棋)中以3:2战胜樊麾。樊麾2次执黑(第一、三局);5盘都是中盘胜。

 

AlphaGo与其他电脑的比赛:

1、对手为CrazyStone、Zen、Pachi、Fuego、GnuGo,他们和AlphaGo一样,都是单机版。具体版本和棋力如下:AlphaGo(无),CrazyStone(2015,KGS 6d)、Zen(5, KGS 6d)、Pachi(10.99,KGS 2d)、Fuego(svn1989,无)、GnuGo(3.8,2k)。KGS大致相当于国内围棋网站如弈城、新浪、Tom等。

2、还有一个更强的对手,Distributed AlphaGo,即分布式的AlphaGo。

3、AlphaGo和Distributed AlphaGo的算法是相同的,差别在于硬件资源。AlphaGo有48个CPU和8个GPU,而Distributed AlphaGo有1202个CPU和176个GPU。作为比较,CrazyStone只有32个CPU,而Zen只有8个CPU。

4、AlphaGo慢棋5:0胜职业二段樊麾,快棋3:2胜樊麾。

5、电脑之间的比赛,每步棋最多5秒钟。

6、AlphaGo(单机版)比其他电脑强很多:495局比赛中,只输了1局;在与CrazyStone、Zen和Pachi的让四子对局中,AlphaGo的胜率分别是77%、86%和99%。

7、Distributed AlphaGo的棋力更强,他对单机版AlphaGo的胜率是77%,对其他电脑是100%。

 

关于电脑的棋力:

1、AlphaGo之前的电脑可以算是业余高手,CrazyStone和Zen都是KGS 6d,大致是弈城6d或者更好一些的水平,大概是业余5段的水平。

2、职业棋手对此前电脑(大致是Zen)棋力的评价:周俊勋和俞斌都说能让4-5子,罗洗河说能让9子。估计也应该有业5的水平。

3、职业棋手认为AlphaGo的棋力应该有职业水准,大致是顶尖棋手先二的水平。也就是说,顶尖棋手可以让先或者让二子。

4、AlphaGo对Zen的让四子对局,胜率为86%。Distributed AlphaGo的棋力更强,他对单机版AlphaGo的胜率是77%。

5、Nature文章估计,AlphaGo的棋力大致是职业二段(樊麾是职业二段,也是用来衡量棋力的标尺)。从文章给出的误差棒来看,樊麾的水平(误差棒)在1p-4p之间(也许是9d-5p,反正起伏很大就是了),而AlphaGo的水平很稳定,就是2p。Distributed AlphaGo的棋力大概是4-5p。

6、因为所有的对局都是去年10月之前的,AlphaGo现在的棋力应该是更强了。

7、已经公布的信息不足以推断AlphaGo的棋力,只知道他至少具有业余顶尖高手的棋力, 强于樊麾,弱于Distributed AlphaGo。(PS:战胜樊麾的是Distributed AlphaGo,而不是单机版的AlphaGo???)

 

关于AlphaGo与李世石的比赛:

1、比赛时间是今年3月,地点是韩国首都汉城。五局胜负制,无论胜负如何,五局都要下完。出战李世石的是AlphaGo而不是Distributed AlphaGo。

2、业余爱好者都看好李世石,职业棋手认为没问题,AI专家认为值得期望。柯洁(目前中国排名第一的棋手,也是现在世界最强的棋手)认为AlphaGo取胜的机会不到5%。

3、李世石是冠军数最多、人气最高、名声最大的现役棋手,他出来拿这100万美元的广告费是实至名归的。

4、当事人都谨慎乐观:李世石说要争取4:1或5:0;DeepMind团队很有信心,认为大致是五五开。

5、第一局比赛非常重要。对于李世石来说更是如此。

6、形势对李世石非常不利。“胜之不武,弗胜为笑”。李世石在明、AlphaGo在暗。AlphaGo知己知彼,而李世石知己而不知彼。AlphaGo肯定研究过李世石的所有棋谱,甚至与李世石交过手的棋手的所有棋谱;AlphaGo的有效棋谱只有5-10盘,甚至连这几盘棋谱也谈不上有效,因为这些棋谱显示不了他的真实棋力,只能说明他比樊麾二段强。不知道比赛协议里有没有说在比赛前给李世石提供足够的棋谱,即使提供了李世石也很难得到多少有效信息。

7、我看好李世石,我认为至少是七三开(前几天我认为是九一)。我认为AlphaGo和李世石应该都能赢至少一盘棋。李世石应该是4:1拿下比赛。如果直落三局的话,有可能是3:2.

 

山雨欲来风满楼

 

 

附录一: 学术论文

google公司DeepMind团队

Mastering the game of Go with deep neural networks and tree search

David Silver, Aja Huang, ......, Demis Hassabis

A computer Go program based on deep neural networks defeats a human professional player to achieve one of the grand challenges of artificial intelligence.

Nature  529, 484489 (28 January 2016) doi:10.1038/nature16961 Received  11 November 2015  Accepted  05 January 2016  Published online  27 January 2016

 

Facebook公司(田渊栋Yan Zhu

Better Computer Go Player with Neural Network and Long-term Prediction

Yuandong Tian, Yan Zhu

(Submitted on 19 Nov 2015 (v1), last revised 26 Jan 2016 (this version, v2))

http://arxiv.org/abs/1511.06410  

 

附录二: 棋界反响

新浪专题: 围棋人工智能来袭

http://sports.sina.com.cn/zt_d/deepmindalphago  

 

人工智能5-0欧洲冠军 李世石将捍卫人类尊严

http://sports.sina.com.cn/go/2016-01-28/doc-ifxnzanh0180135.shtml  

 

李世石:请人类支持我 争取不让电脑赢到2

http://sports.sina.com.cn/go/2016-01-30/doc-ifxnzanh0405068.shtml  

 

世界冠军谈谷歌围棋:人类应放下自己的骄傲

http://sports.sina.com.cn/go/2016-01-30/doc-ifxnzanh0397466.shtml  

 

樊麾裁判设计者专家谈谷歌围棋 或战胜李世石

http://sports.sina.com.cn/go/2016-01-30/doc-ifxnzanm3838179.shtml  

 文章来源:环球科学

 

附录三:知乎科普

如何看待Google围棋 AI AlphaGo 击败欧洲围棋冠军?

https://www.zhihu.com/question/39905662  

 

 

田渊栋,卡耐基梅隆大学机器人系博士,Facebook人工智能组研究员

https://www.zhihu.com/people/tian-yuan-dong  

 

附录四:我的看法

1、棋力很难从棋谱上估计出来的。终究是盘上见胜负,旁观者很难看出来的。就像日本人当年评价中国的古棋,有说黄龙士中盘十三段的,也有说范施不过业6的,但是也有人说公道话:不到棋盘上下一下,谁也不知道他到底有多强。对林海峰的评价也类似:林先生的棋看起来一点也不厉害,可是你坐到棋盘对面,就能感觉到他的力量了。

2、我看了第一局樊麾(黑)对AlphaGo的棋谱。 白136,居然在围中腹,俨然宇宙流的架势。 通盘没有劫争,没有转换,不知道为什么。按理说,他们这种棋手,劫争、转换是必然的啊。 眼看着要输棋,也不用胜负手,就这么输掉了, 太奇怪了。难道AlphaGo的形势判断、局面控制能力都非常强?劫争、转换、惩罚无理手,无论哪个都很强?按说不应该啊。一众职业棋手说他是先二的水平,未免太托大了。 就算是柯洁对阵樊麾,也没有横扫五蛋的把握吧?

3、刚看了AlphaGo对战李世石的新闻发布会,DeepMind信心满满,自认为胜负五五开。不知道他们为什么这么牛,难道对樊没有出全力?

4、要跟AlphaGo对局,必须进行战斗,铺地板肯定是不行的,一定要做劫、转换。李昌镐上场也不一定必胜,因为他的看家本领是不出错;老聂上场估计不行,因为他虽然前五十步天下第一,但是后半盘的漏招太多;曹燕子、古大力之类的上去,估计收拾AlphaGo就像收拾菜一样,说不定摆上两子都能赢。所以说,这次比赛,李世石必胜!

5、期待三月的对局,我相信李世石会赢。他肯定会做战、纠缠、劫争、转换,希望电脑能拿下一局,要是成了黔之驴的话,就太无趣了。

6、好在很快就要和李世石比赛了。是骡子是马,拉出来遛遛。我觉得李世石肯定能拿下来,但是,围棋能坚持几年呢?也许五年,也许十年,但绝对不是遥遥无期了。

 

有感于DeepMind击败围棋职业选手  

http://blog.sciencenet.cn/blog-1319915-953005.html  

 

围棋之幸与不幸

http://blog.sciencenet.cn/blog-1319915-953081.html  

 

关于AlphaGo战胜职业棋手的一些评论

http://blog.sciencenet.cn/home.php?mod=space&uid=1319915&do=blog&id=953190  


千年未有之大变局:关于DeepMind团队AlphaGo的更多信息

http://blog.sciencenet.cn/blog-1319915-953678.html


 

 

千年未有之大变局,我们适逢其会了。

 

 

 

PS:

居然置顶了。那就补充一些信息。

现在网络上对这件事情的讨论很多、很热烈,但是坦率地说,价值并不大——因为绝大部分都是事后诸葛亮。

另外几个就是当事人了:DeepMind信心十足,当然你可以认为他是在给自己打气;樊麾认为对手非常强大,当然你可以认为他是在给自己的失败找借口;李世石认为自己肯定赢,但是他没有任何对手的有效信息,AlphaGo和樊麾的那几盘棋能够告诉李的信息量基本为零。

我只见到一个局外人预见到了这件事情。2014年底,他就认为现有技术已经可以使得电脑在围棋上战胜人类了。

所以,他的意见是值得考虑的——他认为,这次李世石很可能会输的。



马骏 编辑于 2016-01-29
https://www.zhihu.com/question/39906815/answer/83954700  

立个FLAG,能战胜。
虽然AlphaGO和樊麾比赛的时候,棋力是弱职业选手水平,但已经证明这条路走对了(更重要的是,终于有大公司投钱搞围棋AI了),接下来提高水平只是时间问题。
虽然从去年10月到今年3月,AlphaGO是否已经进步了足够多能够战胜李世石,我也没有100%的把握,但这不重要。是今年3月超过,还是再过几个月超过,长期来看无关紧要,重要的是在不远的将来,AI和人类围棋水平的差距,必将达到赛跑水平的差距。所以我这次先大胆投给AlphaGO了。
附一个我2014年立的FLAG,当时大家对围棋AI的前景还很悲观:
围棋作为唯一一种电脑下不赢人的大众棋类,是何原因导致?以及量子计算机出现后有无可能? - 马骏的回答

马骏  发布于 2014-12-23 :
https://www.zhihu.com/question/27169866/answer/35693685  
以目前的硬件水平,已经足以在围棋上击败人类了,根本没量子计算机什么事。目前下不过人类,只是因为没人去研究围棋算法,毕竟在欧美不够流行。
http://www.ifanr.com/476606  
这个新闻里的算法是非常非常粗糙的,训练集也很小,就已经有很好的效果了。只要有人愿意出钱研究,战胜职业棋手只是时间问题。


 


 

 




世纪人机大战:李世石 VS AlphaGo
https://blog.sciencenet.cn/blog-1319915-953678.html

上一篇:关于AlphaGo战胜职业棋手的一些评论
下一篇:功夫熊猫3 很好看
收藏 IP: 124.193.162.*| 热度|

23 尤明庆 刘全慧 武夷山 徐令予 李竞 王毅翔 黄永义 文克玲 李颖业 汤奔阳 田云川 马志超 谢力 宁利中 杨正瓴 秦承志 dulizhi95 tuner yangb919 xiyouxiyou taoshl ssmmachen mxt110

该博文允许注册用户评论 请点击登录 评论 (47 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-8-16 20:22

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部