博文

从AlphaGo与人对棋局的判断看人、机关系精选

已有 5293 次阅读 2019-11-18 23:17 |个人分类:智能哲学|系统分类:论文交流| AlphaGo, 棋局判断, 人机关系, AlphaGo, AlphaGo, AlphaGo, AlphaGo

　　摘要：AlphaGo利用深度神经网络实现对棋局的判断，用来指导蒙特卡罗树搜索，让有效处理围棋的巨大而复杂的空间成为可能，从而战胜人类围棋高手。一方面，与传统算法设计的“分析式”估值函数对棋局进行判断相比，AlphaGo利用机器学习对棋局进行“整体性”判断；另一方面，与人对棋局直觉判断的“多样性”相比，AlphaGo对棋局的判断具有“单调性”，因为赢棋是其唯一目标。人、机之间最大的区别就在于，人是天生的“主体性”学习者，机器则是在人造的“先天性”上才得到自己的“学习”能力的。（注1）

　　一、前言：“一石激起千层浪”

　　二、AlphaGo与传统机器对弈

三、AlphaGo与人对围棋棋局的判断

　　四、AlphaGo与围棋的棋技，棋艺与棋道

　　五、结语

一、 “一石激起千层浪”

2016年3月12日，韩国著名围棋棋手李世石对战谷歌的人工智能机器阿尔法（AlphaGo），经过4个多小时的对弈，到第176手AlphaGo在棋盘上落下了最后一“石”，曾获多项世界冠军的九段棋手李世石向AlphaGo认输，AlphaGo以3比0率先获胜，“石破天惊”，全球哗然!　

“强人工智能”追求者把这次“人机大战”看成是人类社会“奇点来临”（Ray Kurzweil：“The Singularity Is Near”）的一个信号：既然机器的智能可以胜过人的智能，机器反过来控制人类和统治世界就是可能的。另一方面，仍然有很多人相信，机器与人具有本质的区别，机器不会具有真正的感情、自我意识、良心、社会责任等人类独具的能力，遗憾的是现在并没有看到在理论、逻辑上可以对这种信心做出的有力支持。

哲学家、人类学家、社会学家、文化理论家们似乎尴尬，因为对“智能”、“知识”、“情感”、“自我意识”等等最基本的概念几千年来几无定论，人工智能几乎把由概念和逻辑构成的晦涩、复杂、精致的庞大哲学和抽象理论轻松地推到一边去了，在人工智能发展的速度难以预测的情况下，所有的人都是哲学家，直接面对人、机关系的思考。

二、AlphaGo与传统对弈算法

在机器对弈中，所有可能走子序列可以表达为大小为b^d 的搜索树（b:搜索宽度, d: 搜索深度），对于计算复杂度高的游戏，如象棋（b ≈ 35, d ≈ 80），尤其是围棋（b ≈ 250, d ≈ 150），穷举搜索是不可行的，所以需要设计一个最优近似的估值函数对棋局进行判断，以降低搜索树的深度和广度。

国际象棋的棋子具有“个体性”，棋子的角色与在盘面上的位置大体决定了棋局的价值，“深蓝”设计了分析式估值函数对棋局进行评估，20年前就击败了世界冠军。但围棋中，围棋的“棋局”具有一种“整体性”意义，棋局不是由某些棋子与棋盘上的位置关系决定的，而是由每一个棋子与其它所有的棋子组成的“格局”决定的，并且每一棋局的局部与全局具有同样的关系，因此围棋的最优解结构非常复杂，“分析式”估值函数难以对棋局进行正确的判断，所以，对于人工智能来说，围棋是最具有挑战性的经典对弈游戏。

AlphaGo使用卷积神经网络，通过监督学习和强化学习，直接从比赛对弈或自我对弈大数据中训练出来二个深度神经网络：“价值网络”评估棋局的胜率；“策略网络”博弈取样 [1]。与传统机器利用“分析式”估值函数对棋局判断相比，AlphaGo利用机器学习对棋局进行“整体性”判断。

三、AlphaGo与人对围棋棋局的判断　

那么AlphaGo对棋局的“整体性”判断与人类棋手的“直觉”判断有什么异同？对此辨析可以帮助深入认识人的学习与机器学习的关系。

围棋的棋盘是一种简单的平面直交网格，实际上就是欧氏几何平面上的坐标系，在此网格上的游戏实质就是对欧氏平面的基本性质甚至是潜在性质的利用和开发。在围棋中，棋盘上的直交网格的每一位置被赋予非几何的意义：空或占有、气和眼、死或活，实现了几何性和数学性的人为超越结合，赋予了围棋丰富的内涵。

对于同一个棋局，人类棋手各人所看并不相同，因此围棋能体现个人的智力直觉，围棋“易学难精”，就是对人的直觉的自然性与自觉性的超越要求，这是围棋表现为一种高级游戏的原因。

所以，人类棋手在下围棋时会强调心态、境界，这主要是为了得到对棋局的深度理解，由于围棋局面的形成是平面几何空间中的直交网格结构的深度重组，落子就意味着对棋局发展趋势的决策，是历史经验与当前势态的偶合，因此棋手必须专心致志，凝集精力于直觉（棋感），使个人的棋风在当前不确定性的棋局上产生偶合，以期得到“妙手”，使一子之后产生一个全新的局面。

我们于2017年和2019年二次在法国亚眠的科学节上（注2），教完全不懂围棋的小孩下棋，采用了两种现场教学方法。第一种是先介绍最基本的下棋规则，然后让小孩下子，这时参与者每下一子要费周折，第一粒子放在什么地方是很大的困惑；第二种方法是先让小孩任意下子，然后在教学者的陪练中亦步亦趋地学习可行的落子方法。很明显，后者不但使事前完全不懂围棋的小孩能够马上下棋，而且基本上知道了什么是围棋，领会任意落子的奥秘，对围棋产生了兴趣。这个情况引发了我们进一步的思考，从小孩的学习中可以猜测到，围棋的直觉与人的智力有内在关系。

相对而言，AlphaGo用于棋局判断的深度神经网络的输入并不是简单的棋盘信息，而是Deepmind按照围棋规则和他们自己的理解构造的人工特征，共有48个（详见下图 [1]），主要刻划交叉点的“气”数和变化，因此该网络的输入19×19×48，然后输出一个落子概率向量，即在每个合法位置落子的概率。换句话说，AlphaGo的目标只是赢棋，并没有对“棋形”的美感、一致性的策略等方面进行表达。可见，AlphaGo对棋局的判断首先是建立在人赋予的“先天性”看局基础上的，与人对棋局的“直觉”判断的“多样性”相比，AlphaGo对棋局的判断具有“单调性”。在此意义上，AlphaGo的机器学习是人造的“先天性”，并不具有人类棋手“主体性”看局的“多样性”，也就无所谓人的“直觉”。

“What magical trick makes us intelligent? The trick is that there is no trick. The power of intelligence stems from our vast diversity, not from any single, perfect principle.”——Marvin Minsky Source/NotesThe Society of Mind（1987），p.308

（到底有什么神奇的诀窍使我们如此智能？诀窍就是根本没有诀窍。智能的力量来源于我们自身巨大的多样性，而非来源于某一单个的、完美的准则。——马文·明斯基 http://china.caixin.com/2016-03-14/100919927.html）

所以，人、机之间最大的区别在于，人是天生的“主体性”学习者，机器则是在人造的“先天性”上才得到自己的“学习”能力。

四、围棋的棋技，棋艺与棋道

围棋作为棋琴书画”四艺“之一，在中国文化中大体是文人雅士的修性、娱情的文化活动，虽然偶尔以兵喻棋（“略技”），但非以棋为兵，更没有争命的意义，相反，常以棋局喻世态而求超然，与中国特色的”神仙思想“相呼应，人在棋局中，又在棋局外。“烂柯”这个故事的喻意就深得人心，南朝梁任坊的《述异记》和历代其他一些笔记中均有记述，其大意是，樵夫王质入山伐木，见两人在松下石台上对弈，王质观棋入迷，一人递了一枚枣子给王质，王质吃后不知肚饥，后来一人提醒王质：“你怎么还不回去？”王质回头看他的斧头，斧柄竟已烂掉，当他下山回家时，人间已逾百年。甚至宋徽宗赵括也说“忘忧清乐在棋枰”。

围棋的“棋艺”并不创造一种具体形象，而是抽象局面的创造，因此与直觉的审美和情感不同，棋艺要求基于几何性的一种直觉的超层次的理解和创造，这种创造性又是在双方对抗性的个性与共性中进行的，所以围棋对弈不仅是技术的较量，更是从感受到对方的气质、性格、修养的内在性的无言沟通，故称“手谈”，“坐隐”，表达围棋的棋艺是一种抽象形象的共同创造和互动中的内在交流。

围棋界普遍承认，棋手的人品也就是人的棋品，这是指棋手的修养与棋术的关系，人们普遍地把比赛的临场心态，对战略思想、战术机会的把握等作为高级棋术素质，称之为“棋道”。实际上，棋艺建立在人品之上，真正的棋道是人道，这是中国文化和中国学术理性的一种无穷境界：“弈之为道，数叶天垣，理参河洛、阴阳之体用，奇正之经权，无不寓焉。是以变化无穷，古今各异，非心与天游、神与物会者，未易臻其至也。”（清，施定庵，“弈理指归”，序）

机器能够战胜人是“棋技”的胜利，机器不会受到感情、情绪、现场气氛的影响，只有棋盘和棋子之间的复杂关系，不会具有人性和文化的因素，因此对于机器来说，谈不上“棋艺”。机器在技术上胜过人并不奇怪，人使用工具就是因为工具是对人的技术能力的替代。对机器胜过人的担忧或恐惧，并不来自机器与人在力量或思维这样的能力上强大于人，而在于迄今为止我们对于机器与人在本质上究竟有什么不同的认识和理解上并未形成共识。

“人只不过是大自然中最脆弱的芦苇，但他是会思想的芦苇”，帕斯卡尔的骄傲并未过时，机器没有人这种既是最脆弱的同时又是最强大的这个本质性。

五、结语

从对AlphaGo与人对围棋棋局判断的初步分析中可以看出，人工智能中的人、机关系既是人与客观世界的关系，也是人与社会、人与自己的关系，对于认识这种多层次之间缠绕的复杂关系，必须放弃简单性思维才能进行真实的探讨。

我们一直认为只有基于对人的智能的深刻理解，才能清楚地区分机器的人工智能与人的智能之间的复杂关系，而不能以人工智能的观点去理解人的智能，正像在算法理论中，不能将复杂的NP问题（NP，Nondeterministic Problem，“不确定性问题”）简单还原或归约为P问题（Polynomial time problem）一样。

人工智能给我们带来的不仅是物质和社会文明上的进步和提高，也引发人对自我和世界的重新认识，既是机遇更是挑战。

参考资料：

[1] Mastering the game of Go with deep neural networks and tree search, Nature 529 (7587): 484–489

[2] http://gigix.thoughtworkers.org/2016/7/21/comparing-deep-blue-alphago/深蓝与AlphaGo的对比

注1：此文的法语版（Un regard chinois sur la relation Homme-Machine : le cas du jeu de go “人机关系”的一个中国视角：围棋案例）即将在法国丛书“L'intelligence artificielle – Dans toutes ses dimensions.（人工智能- 全方位的视角）”中刊出。

注2：感谢2017年和2019年二次参加法国亚眠的科学节介绍围棋的团队：

- 2019年 : Yu Li, Maryline Rosselle, Jean-Baptiste Hoock, Huang Zhi, Nicolas Li, Pierre-Antoine Doutrellot.

- 2017年 : Yu Li, Olivier Baillet, Shixuan Yuan, Yunbo Peng, Shuzhou Wang.

转载本文请联系原作者获取授权，同时请注明本文来自柳渝科学网博客。
链接地址：https://blog.sciencenet.cn/blog-2322490-1206645.html

上一篇：一战华工与中国平民教育的先驱：晏阳初
下一篇：走向更广阔的世界- 敦刻尔克中法商贸讨论会参会记

收藏 IP: 85.171.213.*| 热度|

不确定性的困惑与NP理论分享 http://blog.sciencenet.cn/u/liuyu2205 平常心是道

博文

从AlphaGo与人对棋局的判断看人、机关系精选

当前推荐数：8 推荐人：王宏琳 强涛 苏保霞 杨正瓴 王安良 姬扬 周忠浩 张鹰

该博文允许注册用户评论请点击登录评论 (8 个评论)

柳渝

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

相关博文

不确定性的困惑与NP理论分享 http://blog.sciencenet.cn/u/liuyu2205 平常心是道

博文

从AlphaGo与人对棋局的判断看人、机关系 精选

当前推荐数：8 推荐人： 王宏琳 强涛 苏保霞 杨正瓴 王安良 姬扬 周忠浩 张鹰

该博文允许注册用户评论 请点击登录 评论 (8 个评论)

柳渝

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

相关博文

从AlphaGo与人对棋局的判断看人、机关系精选

当前推荐数：8 推荐人：王宏琳强涛苏保霞杨正瓴王安良姬扬周忠浩张鹰

该博文允许注册用户评论请点击登录评论 (8 个评论)