格物致知分享 http://blog.sciencenet.cn/u/gzchengzhi 采菊东篱下,悠然见南山

博文

AlphaGo与柯洁第一盘比赛观感

已有 2360 次阅读 2017-5-23 16:10 |个人分类:儒学与现代化|系统分类:观点评述

不出所料,第一盘棋AlphaGo就赢了。当然赢的不多,说明柯洁在比赛前确实做了充分的准备,也为接下来的两盘棋中,打败计算机积累了一些希望。期待25日的比赛柯洁能够取得良好的战绩。

今天的这场比赛开局柯洁就走地线、点三三,颇有AlphaGo的风格,这也是一种以其人之道还治其人之身的方法。这一招看起来还是不错的,在后续的步骤中为柯洁取得了不少的实地,盘中也带来了一些胜利的希望。不过到了官子阶段,计算机的强大计算能力显示了出来,最终柯洁不敌对手遗憾落败。

对付计算机这样不犯错误的对手情况下,人类棋手更要减少自己犯错误的机会。因此在开局的时候选择将实地先稳定下来是一种不错的做法,这样也可以显著减少计算的复杂性。即便计算机能够很准确地计算出外势能够圈到的目数,最终也不过是对半分而已。然后最终的结局就在于各自的运气了。

至于计算机的算法方面,这次据说计算机完全抛弃了人类棋手的棋谱,而采用自主练习的方式,因此对于了解计算机与人类思维方面的区别,这几场比赛就显得更加有趣味。网上流传的观点多数集中于AlphaGo所使用的人工神经网络技术。虽然我也没有仔细阅读谷歌团队的论文,但感觉如果仅仅是人工神经网络技术,可能并没有达到这么强大的能力。否则的话这种技术应该早就用在投资领域并取得辉煌的成绩了,实际情况就是用了这种技术的一些量化投资软件只会让你亏更多的钱。

我感觉AlphaGo的核心是它的记忆增强技术。通过计算机海量的存储能力,不断将外部的数据输入存储器,更新存储其中的数据结构,并分析数据,然后重新输出数据,并给出相应的应对策略。这样的一个数据输入分析和输出过程计算机是不会犯错误的。但是这其中也可能存在一些漏洞,我们可以设想,如果人类棋手在下棋的过程中,故意提供一些错误的数据给计算机,这会导致计算机的计算将该错误放大,最终给出错误的决策。去年AlphaGo与李世石的对阵中,据说李世石就是采用了这样一招比较独特的方法赢得了一盘棋的。不知这是否是AlphaGo 2.0完全摒弃人类棋谱的原因所在。




http://blog.sciencenet.cn/blog-361477-1056655.html

上一篇:谈谈AlphaGO的下一次人机大战
下一篇:人机大战第二盘观感

2 李颖业 icgwang

该博文允许注册用户评论 请点击登录 评论 (11 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备14006957 )

GMT+8, 2018-8-21 14:25

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部