yuedongxiao的个人博客分享 http://blog.sciencenet.cn/u/yuedongxiao

博文

计算与思维的界线 -- AlphaGo 电脑怎样击败职业围棋手 精选

已有 9042 次阅读 2016-2-1 08:27 |个人分类:计算|系统分类:海外观察

我一般是很不喜欢用“电脑”这个词的,觉得这个词很不专业。电脑是 Electronic brain,现在的计算机根本没有思维功能。而 Computer 的大陆翻译则准确多了:计算机。 但看了这盘 AlphaGo 击败职业围棋手(二段)的棋谱,我对 AlphaGo 的计算能力以及思维的界线不能不感到了模糊。思维是什么,计算又是什么?


下围棋中最重要的一点是“感觉”  。对于一步棋、同一个局面,不同的棋手会“感觉”不同。尤其在开局阶段,这种感觉决定了一盘棋的战略取向。超一流的棋手在中盘拼杀与末盘收官时并不见得比一般专业棋手高明很多,但其布局的“感觉”一定胜出一筹。当年的吴清源即使在车祸之后,大脑、体力受到一定影响,在与其他高手对阵中,仍然能在前数十步的布局中保持巨大的优势(但在中后盘的 compute intensive 的战斗中往往会落败)。围棋对人性情的陶冶是两方面的。一方面,是一种认真、顽强、一丝不苟的精神:即使再大的优势,只要一着不慎,满盘皆输;即使再大的劣势,也不要轻易放弃 --- 因为对手可能出错。另一方面,也是最重要的一方面,就是这个大局观的感觉。

围棋的计算机算法与人脑相比,在贴身近战,局部定式变化、局部死活以及终盘收官应该是有优势的。因为这些问题有着更大的确定性,需要考虑的可能性空间大小也有限制。但计算机程序能够像人一样“感觉”局面吗?人的这种大局观真的是那么神奇吗?还是经验长期总结与学习的结果。

如果回顾围棋的历史,我们发现,中国传统围棋基本上不存在布局的概念。中国古代围棋要先放座子,就是黑白在对角的星位先摆上棋子,然后才开始下。这相当于现代的对角星布局。由于其对称性,对角星双方不需要在布局上太费脑筋,一盘棋下来,往往是从一个角杀到全盘,全面混战。围棋到了日本之后,特别是在吴清源之后,围棋的布局选择才开始真正得到了解放,完整的布局理论才得以发展。当年吴清源与日本名人接战,以“三三-星-天元”开局,惊天地、泣鬼神,日本棋界为之骇然。之后,吴氏对于围棋的开创性贡献,岳某不必赘述。

共和国初期号称中日友好,日本围棋界遣一名伊藤老太太前来神州与中国的顶尖高手“南刘北过”进行交流。伊藤老太八战全胜,特别是在一局中,日本老太擒杀刘棣怀的一条大龙,羞得南刘面红耳赤。当此时也,日本人似乎在围棋智力或者思维能力上远远领先汉人。之后十数年,中国人才在陈祖德、聂卫平等人刻苦学习、钻研下,慢慢跟日本围棋达到平衡。

从中国围棋的历史可以看出,即使对于人脑,围棋的“感觉”其实也是基于经验的积累,而这个经验是经过两千多年的实践、承继、摸索而来。地球上即使是智力再高的人,如果只告诉他围棋规则,而没有这个围棋经验的学习,他能够很快成为高手吗?伊藤老太的战绩似乎说明,答案是否定的。

那么,那么,尽管围棋规则极为简单,一个计算机程序,即使是设计得再好,面对无法进行 brute force 计算可能性的围棋棋局,如果不运用人类已经积累的围棋经验就无法成为围棋“高程”,这一点也就不足为怪了。而当计算机程序能够灵活地运用以前积累的围棋经验,包括布局阶段的”感觉”,她就完全可能超出人脑。即使在布局阶段仍然稍逊一筹,只要不太落下风,以当今计算机的速度,正确设计的计算机程序在中盘拼杀以及中盘收官之中将无疑具有令人望而生畏的优势。

这样的围棋程序在围棋这个问题上是不是可以称为“电脑”了呢?

下面是发表在《自然》杂志上的论文,介绍了 AlphaGo 的算法。我对相关研究不很了解,但初步看去,它基本思路是根据之前经验(棋谱)对最佳位置进行更加优化的随机搜索+计算。程序还自己跟自己下,相当于打谱,并记住结果。围棋下一步的可能性无法枚举,那么从前人的经验中随机挑选较好的着点,就大大缩小了搜索空间,再加以一定 计算确认,只要这一步不是太差,计算机完全可以依靠后盘的优势取胜。


(论文下载链接)




世纪人机大战:李世石 VS AlphaGo
https://blog.sciencenet.cn/blog-684007-953790.html

上一篇:《Scarborough Fair》的参考翻译
下一篇:黑洞狂舞之声--引力波畅想曲
收藏 IP: 24.7.123.*| 热度|

10 姬扬 高友鹤 黄永义 李学宽 徐令予 强涛 xiyouxiyou mxt110 yangb919 icgwang

该博文允许注册用户评论 请点击登录 评论 (11 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-25 21:41

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部