博文

【新智元笔记：反伊莉莎效应，人工智能的新概念】

已有 6679 次阅读 2016-1-8 00:20 |个人分类:立委科普|系统分类:科普集锦| 人工智能, 反Eliza效应

【立委按】隆重推出立委版人工智能新概念【反伊莉莎效应】，以后如果进了AI历史，各位都是见证人，发明权属于立委。

我: 人工智能里面有一个著名的现象，叫伊莉莎效应（Eliza Effect），说的是人可以过度解读机器的结果，读出原来不具有的意义。维基百科对“伊莉莎效应”定义如下：

“计算机科学中所谓伊莉莎效应，指的是人有一种趋向，在下意识中以为电脑行为与人脑行为相似。其实只是以简单的语言模式识别为基础的巧妙运用。从具体形式上看，伊莉莎效应指的是，‘人们阅读由计算机把词串成的符号序列，往往读出了这些符号并不具备的意义’。更一般地，伊莉莎效应描述这样一种情形，仅仅依据系统的输出，用户就把计算机系统理解为具有‘其控制（输出）软件完全不可能取得的内在素质和能力’，或者，‘以为（输出）反映了实际上不存在的更大的因果关系’。”

其实，对于人的所谓智能也有类似的一个镜像效应，可以叫做【反伊莉莎效应】（Anti-Eliza Effect），就是很多时候我们把人类的能力神话，忽视了其中 90% 以上的成分其实很水，情不自禁地把所谓脑力劳动归于人类独有的灵性。它实际上是同一个效应的另一面。

拿最近讨论的微软的机助对联诗词来说。在大众的心目中，文学艺术在人类心智活动中具有崇高的地位。电脑作诗作曲听上去就有点亵渎神明，这一切背后其实都有“反伊莉莎效应”的影子。诗词和对联这类很高级的智能活动里面的一些要素，包括押韵、对仗、格律、词序等，这些本来以为是很神，非艺术家不能掌握的能力，其实都可以分解，可以形式化，可以模拟得比人还强。

人的智能其实经不起分解，分解几次以后就发现，人的神性或灵感不超过 1%，99% 是水货。糅合在一起就容易被我们膜拜为大师或天才。人工智能（AI）的目标从来就不是对准那 1%，既不可能，也无必要，总得给人类留点面子。

拿对联来说，属于 1% 的绝妙好联还有：因荷而得藕 (因何而得偶），有杏不须梅 (有幸不须媒）。老友还给了一个“绝对”：莲子心中苦（怜子心中苦）, 梨儿腹内酸（离儿腹内酸）。这类 “机巧”可遇不可求，没办法也无必要去 model 它。没有可重复性的东西不具有AI价值。证明“绝妙好联”不具有可重复性很简单，对于这些对联，基本可以肯定，没有哪个大师还可以找到第二个下联，可以对得同样“机巧”。而机器要做的事情不是唯一，而是一组。这组结果如果排序，second best 与首选通常也不会一落千丈。

宋: 那倒不一定。大师找不到，机器也许能找到。你说的荷杏联，如果有一定的语音知识、百科知识，也许能湊出来。

我: 机器搜索空间大，撞大运的概率会高一筹？不好说。难的不在某一个层面的形式化。

宋: 字形的困难更大一些。

我: 难的是，但不同层面相交的时候，人偶然可以“巧遇”一个最佳组合拿出来说事儿。但机器模型化的时候为了总体效应所给的不同权重，往往在结果中需要排除那种“巧遇”。在所有的路径中，虽然理论上可以把尽可能多的选项输出来，但实际上对于机助系统总要卡一个 threshold，而那些拿出来说事的绝妙好联基本上就淹没在 threshold 下面的某个角落了。不能为了它万分之一的可能性，把一个工具弄得让人受不了，太多的选项人不愿意用或无法穷尽。

宋: 不过这些都是在可以形式化、可以演绎的范围内，困难的只是计算复杂度。真正麻烦的是归纳。现在说的机器学习，都是演绎。

我：的确，比起演绎，归纳不好形式化。

准备正式提出这个新概念 “反Eliza效应”，谈的是人类自我神话的习惯与本能。人类的自我神话表现在读出原来没有的意义和无限夸大人类的灵性。同样一件作品，如果告诉你是机器做的，人会本能地贬低它，以维护万物之灵的自尊或不屑与机器为伍的傲慢。而如果这个作品被相信为文物，便会引来无数解读和赞赏，挖掘出本身完全不具有的各种意义来。

文学评论中的一多半都有这种效应的反映。对抽象派的艺术、行为主义的艺术，这类效应被合理化了，读出作品不具有的意义，每个人读出不同的意义，被认为是作品本来的价值，甚至被认为是学养和素质的必需。指出皇帝没穿新衣，作品没有意义，不仅需要勇气，而且也破除不了这个魔咒，因为美学的理论在抽象派中已经无需新衣的装饰。

反伊莉莎效应是神秘主义的表征，而神秘主义是人类的一种本性。这是一个巨大的题目，有的可挖。这个效应是一个很好的概念，将来有望成为AI领域的基本概念之一。

不是要否定人类的至高无上，也不是要否定人类的 1% 的灵性和天才。只有最蠢的人才会如此自我否定，糟蹋人类。但是，无论科学还是工程，讲的都是丁是丁卯是卯。我们在 AI 的道路上和实践中，第一件要做的事儿就是剥离。把笼统的 “智能” 像外科医生一样用手术刀层层解剖，把 99% 的物质与 1% 的灵性剥离开来，然后我们才会让机器去 AI 99%，在人类日常智能活动中杜绝和取代平庸，并自觉地保持与 1% 的距离及其对真正“人智”的尊崇。

人工智能应用的一个大方向就是机助人工，不必盲目追求全自动，勉强机器去拼 1%，而是把人的智慧交给人，尽量最大化让机器逼近那 99% 的苦力。这一原则在微软机助对联和诗词系统得到了初步而有效的体现。

换一个角度，凡是机器可以实现的AI本质上都是水货。很明显，随着时间的推移，越来越多的水货会从我们认为的万物之灵的智能里面剥离出来，一定会有剩下的，永远无法剥离的部分，那就是真实“人智”（同义词是，灵性、灵感、灵魂、悟性、神明）。

宋: 机器智能与人的智能的区别在于，机器只能在有限封闭的范围内进行搜索，这种搜索本质上是演绎。人的智能是归纳，归纳中又使用连想、类比，所涉及的范围是没有边界的，无法形式化。立委说的剥离，就是人找到了解决问题的套路，告诉了机器。至于人没找到套路的，则还属于尚未剥离的部分。但是如何找套路，需要人的归纳，机器没办法。学数学据说是要训练演绎能力，我觉得更重要的培养（不是训练，而是悟）归纳能力，如何在没有套路可循的情况下引入新的概念、新的引理，最终导致解决问题。从这个意义上说，让机器去解高考题，对于人脑智能的研究不会有本质的帮助，因为这个任务的实质是让人找出解答高考题的各种套路告诉机器。

我: 是啊，人找套路或算法的过程需要调用人的“高级智能”，也许这才是 1%。

宋: 人有可能找出各种复杂问题的求解套路，但是找不出“悟”的套路。

我: 但是，套路只要一个个去找，就会像蚕吃桑叶一样，一点点扩大形式化的疆域。疆域的每一个进步，就是智能的进一层剥离。也就意味着以前认为的“智能”不再属于人独有的智慧。所以说，如果人是 1%的神和 99%机器的杂交物，总有一天会让机器取代人的 99% 知识（智能）活动。

宋: 剥来剥去，还是有极限，“悟”是剥不动的。

雷: 有魂才有悟。

宋: 什么是魂？

雷: 智能之上。

我: 剥不动就承认其边界，归到 1% 的神手里，供起来。

现在的困难是，每一个具体的所谓 “智能” 任务，大多数还是一坨泥巴，没有被剥离。只有在剥离工作积攒得越来越多以后，再回头看那不可剥离的 1%，才能最后确定到底什么是神圣不可侵犯不可模拟的灵魂或神明。在此之前，人类往往在神话自己的能力，把根本不属于属灵的悟性，归到人类独有的智能里面。看一下历史。

在前电脑时代，计算能力被普遍认为是人的了不起的智能。记忆能力也是不得了的能力。一个人如果有超常的心算能力或过人的记忆能力，很容易成为人中杰，作为高智能的天才被人尊崇膜拜。

计算器和电脑出现以后，打破的第一个神话就是计算。现在就是最反智的人，也把计算排除出智能的外延了。电脑在计算上完胜人，是如此理所当然，没有人因此把计算器看成是智能机。

计算之外是记忆。说记忆当然不仅仅是存储能力，还有配套的检索能力。很多的智能在剥离以后，就变成一个 customized 的检索算法加上存贮。于是智能的神秘面纱就被非神秘化，物质化，机器化了。

譬如自然语言理解（Natural Language Understanding，NLU）。语言理解是公认的人类关键智能。幸好，我一辈子就做这个活儿，有一点发言权。为了避免无谓的口水战，咱们先把语言理解缩小成语言的结构分析（parsing）。这种缩小是合理的，因为至少 parsing 被认为是语言理解中的核心的环节，也一惯被认为是人的语言能力的一个重要的部分，这是有共识的。可以负责地告诉大家，parsing 这种智能里面，最多有 1% 的东西暂时不好剥离，99% 的 parsing 能力不过是语言学算法 + 语言知识库（存贮）。我现在的 parsers，无论英文中文，就接近或达到这个水平了。特别是开发更久一点的英语 parser，我随机从网上 copy 英语句子，parse 出来的结果，50% 以上的时候，超出了我的预期或我的能力。不到 50% 的时候显示出还有些许的改进余地。99% 的语言现象能结构化。结构化是一个可以测量的目标。

D: parsing只是结构的分析，或者说一种语言学上的结构定义和分析，只是一种识别或者说系列标注方法，这种结构机器无法理解，而理解更多是从语义上来说的，需要支持推理，支持新知识的产生。

我: “这种结构机器无法理解”，很误导。无法理解为什么要做，难道 parsing 做了就是为了好玩？根本上还是为了机器的“理解”啊，理解了才有动作，才可以测量。

理解有不同的定义，在NLP应用的真实世界，理解的落脚点是 grounding，是与特定应用的某个目标接上。接上了就是理解了，接不上就不能认为是理解了，这是自然语言理解的 AI 真义。针对这个，parsing 提供了理解的坚实基础。

现实的做法是，把理解留到产品语用的层面去定义，因为那是NLU的终极目的，定义不会扯皮。在语用层面定义的理解，可以实现为parsing结构化以后的应用层面的开发。实践表明，这个应用层开发的理解对接是短期可以完成的。也就是说，NLU 已经到了这个地步，只要产品对理解有一个明确无误的要求，在靠谱 parsing 的支持，一般没有做不成的。包括情感分析，这是我们过去五年的主打。也是 NLU 中几乎是最难的部分了。

从 NLU 或 deep parser 回到形而上，我想说的是，我们原先以为的人的智能，经不起剥离。每次剥离的实践，都让我们一次次有跌破眼镜的体验。很多智能有一种天然的【反伊莉莎效应】，不仅是对普罗百姓，而且对我们这些业内人士也是如此。在你没有钻进去之前，你会觉得这个智能很神妙。但你剥离了大部出来以后，开始算法化，形式化，知识存贮化以后，妈呀，原来就是这么个机械玩意儿呀，怎么以前那么神秘它呢？只能说，神秘主义是人类的本性之一。

白老师评论：@wei “反伊莉萨效应”的另一个比较接近的说法是“人类沙文主义”。集异璧里有相关描述。

MT 杀手皮尔斯（翻译节选）

新智元笔记：微软小冰，人工智能聊天伙伴（1）

《新智元：有了deep parsing，信息抽取就是个玩儿》

【征文参赛：美梦成真】

泥沙龙笔记：parsing 是引擎的核武器，再论NLP与搜索

【置顶：立委科学网博客NLP博文一览（定期更新版）】

转载本文请联系原作者获取授权，同时请注明本文来自李维科学网博客。
链接地址：https://blog.sciencenet.cn/blog-362400-948905.html

上一篇：【泥沙龙笔记：default，默认的标配】
下一篇：【新智元笔记：理论家的围墙和工程师的私货】