博文

人机围棋大赛之后精选

已有 12401 次阅读 2016-3-16 08:06 |个人分类:科普|系统分类:科普集锦| 人工智能, 博弈, Alpha, 李世石, 围棋赛

Alpha Go大胜李世石赚足了世人的眼球，被誉为机器与人类的大战，人工智能对人类的挑战从小说电影，被这场围棋赛生动具体地放在人们的眼前，引起了许多的争论和深思。

韩国律师说，Alpha Go集人类无数的围棋经验，动用数百台电脑对李世石的发招，进行了并行运算后下子，相当于围殴，这不公平。他不懂，其实谷歌只是借此来展示软件技术进步，无关公平竞赛和个体荣誉。以计算机硬件发展的速度，用单板机代替几百台电脑的能力，不过是十来年就能办到的事。人工神经网络的AI，也已成功地应用在生活中，关键是想做广告：谷歌领导着潮流。

有些评论，对AI的理解，还停留在符号主义演绎推理智能的时代，认为这机器的判断能力是程序赋予的，是把人类掌握的知识列为规则，让机器在演绎推理中有章可循，机器不过算的快，想的深，不知疲劳而已。这思路确实是上个世纪80年代前AI的主流。1981年，日本曾投入了大量的资金，开始雄心勃勃第五代计算机的研究。然而模仿人类智能的专家系统，在长达十几年探索中，人们认识到有两个根本的问题绕不过去。一是互动（Interaction）问题，符号主义的系统只能模拟人类深思熟虑的理性，机器人发展最需要的是感知、移动、互动，而不是人类最无趣的抽象思维技能。二是放大（Scaling up）问题，想象中无限美好的前景，只限于较窄一类问题的专家咨询，或小尺度游戏问题的演示；将证明过原理的设计原型，应用到实践时，各种复杂因素产生了组合爆炸。人类瞬间都能做出的判断，例如识别人脸，穿过有家具的房间，对计算机都艰难无比。所以沿着符号主义路子的AI，穷尽搜索和启发推理，可以胜任简单的棋类博弈，却难以落子“方寸之间，深不见底”的围棋。

围棋的定式和审时度势，可以归结为模式的识别和应对。这是一种“感性的”或举一反三的联想智能。从上世纪50年代初的Perceptron人工神经网络，80年代由BP算法复兴的浅层网络，到本世纪初构造具有卷积功能网络（CNN）来复合深层网络，无监督和监督的深度学习，都是通过样本的训练，以改变网络中人工神经元间的联接权重，来学习经验。这种联结主义模型产生的是一种下意识的感性智能，与符号主义的理性智能不同，你无法将知识直接输送给它，它也无法告诉你，凭借着什么特征或规则得出了具体的结论，它却像经验老道的高手，对熟悉的情况能够做出明智的判断。人工神经网络的技术，已经广泛地应用在我们的生活中。2014年Facebook，应用9层神经网络的深度学习方法，对人脸的识别率可达到97.25%，而在电话答复系统，iPad的Siri中，各种代替人力的语音辨识技术已被广泛地应用。机器在模拟视觉和听觉的辨识能力上已经非常接近于人类了。

Alpha Go的技术核心是基于神经网络的深度学习，用了3000万步的职业棋手棋谱来训练对棋势的“悟性”。这次的比赛，只不过是以轰动的形式，告诉人们联接主义AI的进展。

Alpha Go对李世石的胜利，让许多人深思后毛孔悚然。在四五十年前，专家系统的AI时代，人们曾好奇地问，计算机会比人类更聪明吗？智能机器人会反叛吗？有知识的人那时都很淡定：机器是在人类制定的规则中行事，其智慧不外是在人赋予的知识内进行逻辑推理，可以规定机器人三定律，第一法则是“机器人不得伤害人类，……”。对那时的AI可以这么想，但如今深度学习的联结主义机器，完全在模仿脑子的功能，虽然现在还需要我们帮助构建先天的联接拓扑和挑选训练的内容，实现的还只是人类智力的某项功能，离综合智能还很远，但不难想象今后具有更快速度更大容量，能够在互联网中自学的机器。令人忧虑的是，这种联结主义机器的脑子是个黑箱，它是怎么想的，知道些什么，为什么会这样想，我们都无法了解和控制。即使拆开硬件，企图分析具有亿万联结的数据也无济于事。

生物在某些智能上超越人类的很多。在辨识方面，狗的鼻子远比人灵敏，很多动物在地震前都能警觉，凶猛动物判断速度调整机体预测反应的能力，都胜过人类，我们对此欣赏而不忧虑。人造的机器，其力量速度和精确性是人类不可比拟，计算机的计算推理能力超越了人类，我们也泰然处之。这些不可怕，因为在人类的智慧面前，它们都是可控的。我们为什么这么担心AI？

圣经里说，全能的上帝创造了人类，无忧无虑无知无识地生活在伊甸园里，直至受到蛇的诱惑，吃了智慧果后知善恶，自己能够做判断，这越出上帝指导的企图，引起造物主的震怒，便成为人的原罪。今天的人类凭借着智慧发展了科技，也扮演着上帝的角色，建造伊甸园，圈养宠物，创造机器。当人造的机器拥有智慧也能独立判断，不再对人唯命是从时，我们能够在机器预埋原罪的观念，用圣经教化它们吗？西方人的忧虑来自其文化深处信念的自省：人因智慧成为万物之灵，替代了上帝主宰着世界，害怕当机器的智力超越人类时，我们将如何自处。以致于有人大声疾呼：要禁止AI的研究，它终将会奴役人类！

但这只是一元神文化孕育出的创造与驯服的思想模式。信奉绝对力量的征服。中国传统文化，深思过人与环境和谐相处之道，在那里没有全能全知的神，人也从未真正统治过世界，着眼于胜负之技只是工博弈之“术”，逆天而行不可为，而知天意则要悟其“道”。既然忧心于人类与机器智能的冲突，那就从博弈之道来看未来吧。

智能作为动物的一种本能，确是为自然竞争而进化来的。模式识别为生存博弈之所需，识别环境分辨敌我和伪装欺瞒，都是竞争中的智能，在生物识别和欺瞒的博弈中，双方都是以最小的代价争取最大的收益。在机器识别技术与客户欺瞒智力的博弈中，双方也依对手而采用恰当代价的策略。所以技术的升级是在博弈中交互变化的，道高一尺魔高一丈。

象棋围棋只是固定规则限制手段的一种博弈，在生存发展进化中，环境目标能力手段是多变的。机器能否识别任何的模式，发现其行为的规律？其实这也是人类科研的梦想。这可能吗？

感知只是事物的部分属性，所以识别只能是部分地确定，而模仿总是可能的。识别和欺瞒的对抗竞争中，智能的升级没有止境，意味着识别不总是可能。事物的规律是行为的模式，从博弈的观点，博弈的结果由局中各方的策略而定，没有一方能单独决定结果。无论是机器还是人，一旦有了自主的意志，对方就无法确定其行为，也就无法把握规律和结果。博弈总是以不对称的优势取胜，所以识别模式和掌握规律总是有限度和暂时的。

能否通过学习渐进逼近被识别的模式？这取决于它所在的博弈局势。例如对“少数者胜（minority game）”的局势，获胜的机会在于与众不同。比如说，两条平行车道哪条更挤的问题，或者股市变化的模式，若有确定的答案，局中的其他智者都据此行动，这样原来不挤的车道就变挤了，原来能获利的机会被人下套了，因此这模式就不再是对的了。对许多博弈，没有不变的取胜模式。

因此生存竞争并非仅因智力就能取胜。机器不可能因智力优势便能淘汰人类。

竞争中的博弈并不仅仅是对抗，合作往往是双赢的优势策略。识别和理性也是为合作而生的智能。对于“从众博弈”，即随大流能形成合作互利的局势，必然会出现“路径依赖”的现象。最早被传播的论断，认知或应用，即使不是最合适的，也最终会成为公认正确的模式。山间的小路是这样走出来的，网络语言是这样流行的，键盘的字母分布也是这样成为标准的。这种局势对学习最有利。实际上，有效辨识大部分事物的模式，语言的形成，人类的交流、学习和知识体系的成功，就是基于这类博弈局势上的学习效率。现在机器智能的发展与人类的需求也正是处在这种利于合作的局势。

机器智能的发展，因人类对生活舒适需求而来，如同代替体力劳作的机器发明一样不可抗拒。不难预测人工智能在各项智力活动中将逐一超越人类。奇点到来时，技术的发展将超越人类的理解能力，无法预警其发生。人们因此而恐惧。但是，我们真的已经理解自然和我们生活的环境吗？科学的发展让我们已经习惯于，用种种人为定义的概念和原理，诸如物理概念定律，经济规律，社会理论等等来构造世界的图像，其成功地解释我们观察到的现象，让我们认为真实的世界就是如此，而忽略去无数不能纳入这个图像的事实，以及我们理解能力之外的因素。因此，当机器的智能超越我们的理解时，也不足为奇，我们也很快就有能够自圆其说，来理解这个世界的理论。

也许人们担心的是未来的机器是否会奴役人类。现在的机器智能还是完全依赖于人类来发展的，其“世界观”的形成来自人类的文化的信息样本。人类的文化给予机器智能早期的教育，也将形成将来AI依赖的思想路径。机器的智能靠与人类的合作得以进化，未来的生存竞争会否陷入“囚徒困境”的博弈局面，人与智能机器的未来是陷入征服的恶斗，还是携手合作，取决于我们对机器的心态，对自身的理解和文化的传承。

据说，外星人觉得人类是汽车的奴隶，每天汽车把人吞进去，嬉戏奔跑，休息时再把人吐出来，让人给它洗刷护理，美容保养，辛劳地负责它的生育、提高、修理治疗的终生服务。

【说明】此文部分内容摘自我已发表过有关深度学习的专栏文章“智能的进化与博弈”，《中国计算机学会通讯》P50，114期，2015年8月。

相关专题：世纪人机大战：李世石 VS AlphaGo
转载本文请联系原作者获取授权，同时请注明本文来自应行仁科学网博客。
链接地址：https://blog.sciencenet.cn/blog-826653-962903.html

上一篇：捷克谈吃
下一篇：智能的进化

收藏 IP: 50.156.25.*| 热度|

当前推荐数：51 推荐人：尤明庆 刘全慧 陈德旺 武夷山 郑小康 科董越 许培扬 陈钢 田云川 文克玲 黄彬彬 陈昌晔 彭思龙 李泳 赵美娣 程代展 姬扬 李颖业 崔树勋 李建雄 黄永义 张士伟 李天成 陈志飞 张天蓉 李红雨 柏舟 鲍海飞 康建 刘灵通 史晓雷 王林平 徐晓 刘锋 鲍得海 王涛 张越 王春艳 褚昭明 侯沉 tuner xqhuang xiyouxiyou neilchau zjzhaokeqin yangb919 aliala lrx icgwang gaoshannankai ganendexin1993

思想海洋的远航分享 http://blog.sciencenet.cn/u/xying 系统科学与数学水手札记

博文

人机围棋大赛之后精选

该博文允许注册用户评论请点击登录评论 (84 个评论)

应行仁

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

相关博文

思想海洋的远航分享 http://blog.sciencenet.cn/u/xying 系统科学与数学水手札记

博文

人机围棋大赛之后 精选

该博文允许注册用户评论 请点击登录 评论 (84 个评论)

应行仁

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

相关博文

人机围棋大赛之后精选

该博文允许注册用户评论请点击登录评论 (84 个评论)