博文

Let’s Go : 围棋的诱惑与智力的边界精选

已有 14999 次阅读 2016-3-9 12:03 |系统分类:观点评述| 人工智能, 围棋, alphago, 李世石

Let’s Go : 围棋的诱惑与智力的边界

王飞跃

所谓的“人机世纪大战”，谷歌的AlphaGo与南韩李世石的对决即将上演，这不但让我想起差不多20年前IBM“深蓝”与卡斯帕罗夫的国际象棋比赛，也被许多人称为是“人机世纪大战”，计算机终于胜了，但对人工智能的研究至今几乎没有产生什么的影响；还让我想起人工智能创始人之一，得过诺贝尔奖的司马贺(Herbert Simon)在人工智能开始之初就曾预言的：到1986年，人工智能将在所有的棋游戏上战胜人类，而且全面战胜男人，无法战胜女人是因为人工智能不能生产下一代(大意如此，或许是Minsky或别人讲的，其实人工智能生产下一代比女人筒单容易的多了！不信可读一下von Neumann的论文)。

我现在非常希望AlphaGo能战胜李世石，这与几天前的想法很不一样。因与国际象棋不同，中国围棋的机器化必须依靠人工智能方法。当下的人工智能之火太盛，接下来难以继续。如果AlphaGo 赢了，不但能延人工智能之火，而且万一智能产业发展不顺，就可成为许多人许多事的“替罪羊”。不过，无论这场人机“世纪”大赛结果如何，谷歌都赢了。这次的市场营销宣传，谷歌做的极其漂亮，必将成为新IT时代智能广告的“世纪”典范。或许，将来计算机围棋比赛会成为所有人工智能公司的“标准广告赛”。

围棋的诱惑

围棋是对立统一的结晶！黑与白、浅与深、易与难，简单与复杂，全在19×19的361个方圆天地之间。非常后悔自己年轻时没有花时间学习围棋，尽管同学中有许多围棋高手，包括当年中科院研究生围棋比赛的冠军，可当时一想一盘棋至少半天时间，又有许多更"要紧"的事要做，只好作罢。

上世纪九十年代初，我与Terry Triffet 和Herbert Green 两位老先生合作进行大脑的计算建模研究时，Green教授曾鼓动我与他一起做人工智能围棋。Green是量子物理学大家Born的学生，就是著名的BBGKY Hierarchy中的G，后来去了澳大利亚做教授。他有许多爱好，我最了解的有两样，爬山hiking和下围棋。他说他围棋下的很好，告我日本人因为怕围棋输给外国人丢脸，比赛前硬给他安一个“名誉”日本公民，然后再比。为了找人下棋，Green自己在澳大利亚成立了围棋俱乐部，开始就设在自己家里。Green在UA访问期间，开始拉我一起参与他用量子力学研究大脑的工作，我说不懂不参加；后找我用AI方法写围棋程序，Green给我看他写的人工智能围棋论文，我说不会也没理，想起来真对不起老人家的热心。

IBM的“深蓝”战胜卡斯帕罗夫之后，我一直希望中国能开发出计算机围棋程序战胜人类的棋手，除了有感围棋源于中国却成于日本之外，还因为围棋才能真正体现人工智能的灵性，而不单单是计算硬件的威力。去年吴韧离开百度后，我们曾在硅谷计划合作举办围棋的人机大赛，我起的名字就叫Let’s Go ，就是想加快人工智能围棋的研发与实践，让围棋在中国人手里输给计算机。这一想法还得到了围棋爱好者，中国自动化学会理事长郑南宁院士的支持，所以我希望由自动化学会出面组织。可惜后来吴韧创业成立“异构智能”公司，加上其他原因，此事只好放下。当时我自己的心愿是利用平行的方法开发人工智能围棋系统，验证平行智能的理念。昨天闻听吴韧的异构智能将开发“异构神机”围棋程序，非常高兴，即告知我也会尽快组织“平行围棋”队伍，参与将来的相关活动。

智力的边界

《自然》杂志发表AlphaGo文章的方式，加上同时宣布本次大赛的安排，最初都引起自己本能性的反感，一是觉得这是学术圣地的堕落，二是不愿相信计算机围棋能在如此短的时间取得如此大的进步。春节期间，下载相关论文学习了几遍，虽然仍然不知AlphaGo的细节，也不认为其在人工智能方法上有什么突破，但看法却大大改变。利用深度神经网络建立对局势的评估函数，这是Facebook的Darkforest等系统没有的，也使得很大程度上“瞎蒙”的蒙特卡洛搜索树方法从开环的方式转入闭环的、利用价值函数进行优化的形式，这与自适应动态规划ADP方法几乎完全一致！特别让我感兴趣的是Self Play的应用，3000万局的数据！这也正是自己想通过软件定义的对决产生人工数据进行优化的平行围棋的思路，我相信这一方向仍有很大的开拓空间。因为机器学习基础理论表明，能学习多少，水平如何，受限于样本空间。Self Play产生巨大数量没有问题，问题是在什么空间？空间的突破，能否完全离开人的干预，这些论文没有说清楚，但结果似乎很好。不过，《自然》文章中的人机对决，第一局人输二个半子之后，后面四局都是放弃，很难令人信服。虽然机理至今不清，可深度网络已在许多方面证实了自己的威力。人机的这次围棋大赛，理论上结果似乎只应是5：0，至于人胜还是机赢，五天之后便见分晓。

但我还是坚持这与时下热议的人工智能战胜人类智能无半毛钱的关系。任何规则明确的问题或任务都应该是计算机战胜人类，早晚只是时间而已，围棋不应例外。我还坚信既然人的理性是有限的，智力也一定有限，对于机器更是如此，因此不存在什么“奇点”问题。实际上，如果你相信科学，就一定有限，因为整个宇宙的生命都是有限的。“奇点”之奇，怕是在有限生命和空间之外，问题是那里什么点都可以有。

Let’s Go

西方许多人士，包括人工智能的专业精英，都对AlphaGo有着极高的评价和期望，认为这是人工智能的里程碑事件和Human Level人工智能的开始。对此我有不同的看法和观点。这里没有时间展开，但有一点可在此表明。

这次比赛结果非常重要，但其意义不是对Human Level人工智能的研究，而是针对搜索和优化问题的处理。如果AlphaGo大胜李世石，将大大提高人们对深度网络DNN的信心，实际上为优化中的NP-hard问题提供了一个现实的解决方案! 整个系统，整个工厂，甚至整个城市的决策优化问题都可以利用AlphaGo的思路去解决，这就是其最大的贡献。

这将产生一个巨大的新行业，软件定义的系统、工厂、城市将成为现实，大数据真正成了原料，数字化的经验、案例、预演都将成为生产力，计算实验与计算优化将成为管理的“新常态”，或许这就是新IT时代的真正开始？若真如此，我更希望是平行的ADP成为这趋势的开路先锋！

比赛就要开始，Let’s Go，先观大战，有话后说！

相关专题：世纪人机大战：李世石 VS AlphaGo
转载本文请联系原作者获取授权，同时请注明本文来自王飞跃科学网博客。
链接地址：https://blog.sciencenet.cn/blog-2374-961532.html

上一篇：新IT时代意味着什么?
下一篇：人工智能在中国-AI Research in China

收藏 IP: 159.226.177.*| 热度|

王飞跃的个人博客分享 http://blog.sciencenet.cn/u/王飞跃

博文

Let’s Go : 围棋的诱惑与智力的边界精选

当前推荐数：17 推荐人：许培扬 黄永义 武夷山 郑小康 姬扬 翟自洋 伍国华 彭思龙 李颖业 刘洋 李海军 闫钟峰 王涛 shenlu biofans yangb919 gaoshannankai

该博文允许注册用户评论请点击登录评论 (14 个评论)

王飞跃

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

相关博文

王飞跃的个人博客分享 http://blog.sciencenet.cn/u/王飞跃

博文

Let’s Go : 围棋的诱惑与智力的边界 精选

当前推荐数：17 推荐人： 许培扬 黄永义 武夷山 郑小康 姬扬 翟自洋 伍国华 彭思龙 李颖业 刘洋 李海军 闫钟峰 王涛 shenlu biofans yangb919 gaoshannankai

该博文允许注册用户评论 请点击登录 评论 (14 个评论)

王飞跃

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

相关博文

Let’s Go : 围棋的诱惑与智力的边界精选

当前推荐数：17 推荐人：许培扬黄永义武夷山郑小康姬扬翟自洋伍国华彭思龙李颖业刘洋李海军闫钟峰王涛 shenlu biofans yangb919 gaoshannankai

该博文允许注册用户评论请点击登录评论 (14 个评论)