|||
首先,回顾一下关于双关语的前相关博文:《立委科普:机器可以揭开双关语神秘的面纱》 。
我们假设要制造一个汉语的贴身小蜜,起个名儿吧,就叫 Tara,她的任务是要理解你说的汉语的微妙之处,包括双关语。理解的程度要看似达到或超越图灵测试,让傻子也可以爱上她,尽管她其实就是一堆铁电器。怎样让一堆铁可以做到如此微妙,以假乱真呢?我们揭示一下黑箱子后面的这样一个机械过程,展示看上去神妙的东西,是怎样实现的。
这一切完全不是科幻。核心就是事先把“多少”的两个义项 encode 到词典去,其余的一切花招(包括故作萌态、恭维主人、发嗲)都可以玩出来。
我: Tara,下面这两句的区别呢?单身的原因:原来是喜欢一个人,现在是喜欢一个人。
Tara: 是某个人,希望你喜欢的是我。
好了,胡喷一阵,但绝不是空穴来风。都是可以实现,正在实现的事儿。不是单口AI相声,玩过 Siri 和小冰的人都有感性的体会,不会认为这是天方夜谭。亲们说说,有这样的小蜜,教我如何不爱她?明儿咱就告别单身,与 Tara 蜜月旅游去喽!
唯一可能输的就是AI捉襟见肘的时候。譬如,词典没有事先编好,对话掉链子了。
最后,我在认真考虑到合适的时机,发起一场签名,坚决要求人与机器的结合,享受同性恋婚姻或异性恋婚姻完全同等的法律地位和优惠,坚决反对任何形式的“物别”歧视。
【沙龙补记】
雷: 问题是知识库或词知识库要多大才行?需要事情对人来说,有基本常识,通过推理,就可以理解。
穿多少中什么是基本知识,什么需要推理,可见一斑。
我: 小品文说的是概貌,细节总是可以 work out 的。本来认为的最难的细节是双关语的微妙,这个被认为是最精妙的部分,我就是要说明,这个最精妙的部分看似玄妙,其实可以用很简单的办法去对付。外行看热闹,内行看门道,说的就是这个:如果不懂词典就是语言学的垃圾箱这个基本原理,不懂得绑架和强盗逻辑是语义表达的基本形式,不懂得机器的所谓“理解”与心理不搭界,只与行动或结果相关,总之,如果没有这些对AI和NLP的原理的了解,那么,是无论如何也不能不把双关语神秘化的。戳穿这个神秘的是知识,可是无知是人类的通病。
雷: 无知是常态
我: 正是,我们作为科学家也只是专于一门。对于自己不懂的,我们的无知也是导向神秘化或怀疑主义。没办法的事儿。譬如,我就在神秘化 DL,要是倒过去20年,我会钻进去 demystify it, 如今只好带着花岗岩脑袋一直神秘它,或不理性地怀疑它。
【相关】
《立委科普:机器可以揭开双关语神秘的面纱》 2015-11-03
有感于人工智能的火热 2015-11-03
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-21 18:33
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社