|||
这是微信中疯传的一个段子,彰显汉语的微妙:
一老外来华留学4年,主攻汉语。临毕业,参加中文晋级考试,题量超少,暗喜。再仔细一看,懞了!题目如下:
一、请写出下面两句话的区别在哪里?
1、冬天:能穿多少穿多少;夏天:能穿多少穿多少。
2、剩女产生的原因有两个,一是谁都看不上,二是谁都看不上。
3、女孩给男朋友打电话:如果你到了,我还没到,你就等着吧;如果我到了,你还没到,你就等着吧。
4、单身的原因:原来是喜欢一个人,现在是喜欢一个人。
二、附加题:
1.男人对一个女人有好感的原因,一是喜欢上这个女人,二是喜欢上这个女人。
2,男人约会迟到的原因,一是睡过了,二是睡过了。
老外泪流满面,交白卷,回国了。
老友说:“别回国,把这题交给伟哥的NLP做做”。
不错,汉语确实很多微妙的地方,双关语是展示其微妙的很好的语言游戏。但仔细看这些双关语,发现大多有迹可循。其实,很多事NLP想做就可以做,问题是值不值得做。NLP理解语言不需要奇迹,但是可以创造奇迹。那些双关语的语言游戏,内部的结构并没有那么复杂,要做就可以做,只是做实用系统,双关语还排不上队,属于不值得做的“过度思维”,一般不是机制上的问题。 For argument‘s sake,我们拿这句为例来说明:
“能穿做多少就穿多少。”
How beautiful!
Everybody says it is beautiful. I am wondering how beautiful it really is. Can it be more beautiful than my hometown Huangshan?
老朽笑曰:
:) magic and ignorance go hand in hand, hence the AI bubble, which in effect benefits all of us
咱们回到前面的双关语游戏,过一遍识别这些双关的奥秘,基本都是词典或简单句法的事儿,NLP 有清晰的脉络可以形式化地实现它,主要是值得不值得去做,而不是能不能做:
1、冬天:能穿多少穿多少;夏天:能穿多少穿多少。
“多少”,词典识别(感叹vs.疑问:多么地少,how much): (1)能穿多么地少穿多么地少;(2)能穿 how much 穿 how much;
2、剩女产生的原因有两个,一是谁都看不上,二是谁都看不上。
“谁都Vt”, 句法识别(主语vs宾语):(1)谁都看不上 【】,(2)【】 谁都看不上。
3、女孩给男朋友打电话:如果你到了,我还没到,你就等着吧;如果我到了,你还没到,你就等着吧。
“等着吧”,词典识别(及物vs不及物:等着【】;等着瞧):(1)你就等着【】吧;(2)你就等着瞧吧。
4、单身的原因:原来是喜欢一个人,现在是喜欢一个人。
“一个人”,词典识别(强调副词vs,名词:单个儿;某个人):(1)喜欢单个儿;(2)喜欢某个人。
二、附加题:
1.男人对一个女人有好感的原因,一是喜欢上这个女人,二是喜欢上这个女人。
“上”,词典识别(趋向小词vs及物动词:开始V;Vt【】):(1)开始喜欢这个女人;(2)喜欢上(Vt)这个女人
2,男人约会迟到的原因,一是睡过了,二是睡过了。
“睡过了”,词典识别(后果vs时态:睡过头;已睡过):(1)睡过头了;(2)已经睡了。
【沙龙补记】
我: 世界上怕就怕认真二字,昨晚对“双关语”认真了一回,发现微妙的外表下面,是简单的实现可能,绝大多数双关不过是一词多义而已,识别它没有难处。
自动消歧自然是难,但是有消歧的必要么?双关之所以叫双关,就是否定消歧的必要性。
白:笑话就是先放纵局部优势理解成气候,后把局部优势理解颠覆掉的过程。这个过程比结果更有意义。
我: 优势理解就是缺省,非缺省值可隐藏(到优势理解被否定后再用,被否定的最简单办法就是故作聪明地去问信息的主人或受者,当年 askjeeves 的模板玩的就是类似的花招),也可忽略(不值得做)。
总之在应用现场,这个不构成难题。看上去需要高智能的东西,简单的算法即可搞定。人类智能其实经不起这么分解。分解以后,纯粹地属于人的智能所剩无几。
白: 所以,死硬派最后一条短裤都剩不下。非缺省的选择,能排出TOP3足矣。谁有时间跟你逐个纠缠。
我: 凡是功能性的能力,包括语言理解,属于人的地盘总是越来越小,失去领地的速度常常超过我们以前的预计。再过100年,也许只有艺术还可以保存自己的领地,这个还不包括快餐艺术。
从这个角度,我们没有理由不对人工智能怀有信心。有一点已经很清晰了,人工智能在很多层面会超出表现中庸的万物之灵,更不用说滥竽充数者。只有各领域的精英,AI 可能还有距离。
结果就是,各行各业的庸医都会被取代。
对于 tractable 的任务,甚至精英都可能被打败,原因很简单,人再精英,也没有那么大的存储,没有那么快的计算,也没有不受情绪和困倦干扰的保障。我是外语专业的,学了一辈子英语,又有语言学的培训,自认为自己对英语的理解大概算精英级了吧。可是,在不断地开发英语 parser 的过程中,越来越多地发现,复杂句子的分析常常超过我的能力。机器是我训练的,怎么能超出他的主人?实际上还真是这样。
你只要一点一点地把知识灌输给它,如果体系架构和方向设计合理,最终你会发现,它就是超出了你的能力。这一点听上去有点让人丧气,可是还是让 AI 感到鼓舞。
马: 我觉得在很多方面AI的单一能力都可能超越人类,但综合能力就不行了。至少现在还看不出任何苗头。所以根本不用担心什么AI统治人类的问题,完全是忽悠。
我: 统治人类是胡扯,除非你把原子弹的按钮置于机械手的掌控之中,相信它可以做出比人类更理性的决定。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-22 21:15
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社