|||
这些零星的研发笔记显得如此枯燥,涉及的是语言海洋的一片浪花而已。然而,所谓电脑的自然语言理解(NLU)的背后,往往就有这样的语言狂人,一辈子就琢磨这些现象并为寻求“机械”对策而乐此不疲。等到这些零星知识及其机械对策集腋成裘,转化为电脑可以执行的算法而造就出自然语言分析的自动机的时候,又一个AI神话就出现了。一切的AI神话都没有灵性,有的不过是把复杂问题层层分解的路数,内行看汗水,外行看光环,历来如此。人工智能,没有人工,便没有“智能”,皮之不存,毛将焉附。
在科学和IT领域,不乏大佬为人类着急,所谓机器人自主思考、语言交流、统治世界、毁灭人类等危言耸听,甚嚣尘上。先天下之忧而忧的精英与嗷嗷待哺的愚民成为绝配,一个愿打,一个愿挨,构成一道奇特的风景线。如今,alpha-go 赢了人类围棋,人工智能益发被媒体渲染得沸沸扬扬。这里有多少人有兴趣、能力和耐心去以常人能懂的方式去做真正的人工智能的科普,又有多少人有兴趣、能力和耐心去了解所谓机器智能背后的一点儿也不性感的“诀窍”呢?
说点汉语语言学吧,没这个语言学帮助解析,机器怎么可能“理解”汉语呢?
汉语碎片一:“若价格在五十元左右还可以接受^^”
什么可以接受?
条件子句本来是做主句状语的,但这里做了主语,没有这个“若” 字也可以,那就成了一个常规的主语子句。直译成英语,条件子句绝对不可以做主语的:
*** "if it is within the price range of 50 yuan is acceptable"
常规主语子句在英语有对应说法,由 that 引导名词性子句做主语:
That it is within the price range of 50 yuan is acceptable
问题是:汉语多出来的这个“若”是怎么回事呢?
再看:
若价格在五十元左右还可以接受,那么什么价格不能接受呢?
可见,这个条件子句可以是结构歧义的,这时候“若”字就是地道的主从连词了。涉及的句型应该是:
若-Clause [SubjClause+Pred],那么 MainClause
SubjClause[若-CLause] + Pred
汉语碎片二:
同胞说话都是这样断断续续么?今天遇到的是这个句子:第一次网购这样的大件物品, 以后就有信心了.
第一个VP与第二个谓语VP啥关系?谁有信心可以不追究了,应该是“我”,不排除是你,或者泛泛而指。第一个VP背后的意思大概是下述这样的么,如果补全的话?
【我】第一次网购这样的大件物品【因此免不了出偏差】,
以后【我】就有信心【网购大件物品而不出差错】了。
形式裸奔也便罢了,内容省略居然可以达到如此地步! -- 我们人是怎么理解的?
百度翻译: For the first time such a large online shopping items, after the confidence.
谷歌翻译:The first big-ticket items such as online shopping, there is confidence in the future.
人工直译:first time online shop such a big item, in future will have confidence.
人工理解了再译大概是: It was my first time of buying such a big item online, I will have more confidence in such things in future.
白: 第一次网购那个例子,我有不同的解读:潜台词不是“难免有差错”,而是“风险较大心里没底”。“难免有差错”似乎差错是“已然”了似的,但从字面看不出“已然”的意思。
我: 是是。
那就不是:
It was my first time of buying such a big item online, I will have more confidence in such things in future.
而是
This will be my first time of buying such a big item online, (I am not sure I can do it well, but) I will have more confidence in future.
我实际的问题是,此类句子似乎汉语特别多见,模模糊糊,有话不说清楚,需要人去琢磨才能厘清。汉语NLP研发中经常见到这些让人哭笑不得的句子,可读上去大多很顺,国人可不就这么说话的嘛。谁会为了照顾我们机器NLU,就把话刻意说清楚呢?
伟大的中文,I 服了 U,这辈子奏跟丫拼了,偶。
【相关】
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-31 01:53
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社