《镜子大全》《朝华午拾》分享 http://blog.sciencenet.cn/u/liwei999 曾任红小兵,插队修地球,1991年去国离乡,不知行止。

博文

【NLP笔记:人工智能神话的背后是汗水】

已有 4682 次阅读 2016-3-11 10:06 |个人分类:立委科普|系统分类:科研笔记| 人工智能, NLP, 语言理解

这些零星的研发笔记显得如此枯燥,涉及的是语言海洋的一片浪花而已。然而,所谓电脑的自然语言理解(NLU)的背后,往往就有这样的语言狂人,一辈子就琢磨这些现象并为寻求“机械”对策而乐此不疲。等到这些零星知识及其机械对策集腋成裘,转化为电脑可以执行的算法而造就出自然语言分析的自动机的时候,又一个AI神话就出现了。一切的AI神话都没有灵性,有的不过是把复杂问题层层分解的路数,内行看汗水,外行看光环,历来如此。人工智能,没有人工,便没有“智能”,皮之不存,毛将焉附。

在科学和IT领域,不乏大佬为人类着急,所谓机器人自主思考、语言交流、统治世界、毁灭人类等危言耸听,甚嚣尘上。先天下之忧而忧的精英与嗷嗷待哺的愚民成为绝配,一个愿打,一个愿挨,构成一道奇特的风景线。如今,alpha-go 赢了人类围棋,人工智能益发被媒体渲染得沸沸扬扬。这里有多少人有兴趣、能力和耐心去以常人能懂的方式去做真正的人工智能的科普,又有多少人有兴趣、能力和耐心去了解所谓机器智能背后的一点儿也不性感的“诀窍”呢?

说点汉语语言学吧,没这个语言学帮助解析,机器怎么可能“理解”汉语呢?

汉语碎片一:“若价格在五十元左右还可以接受^^

什么可以接受?

条件子句本来是做主句状语的,但这里做了主语,没有这个“若” 字也可以,那就成了一个常规的主语子句。直译成英语,条件子句绝对不可以做主语的:

       *** "if it is within the price range of 50 yuan is acceptable"

常规主语子句在英语有对应说法,由 that 引导名词性子句做主语:

       That it is within the price range of 50 yuan is acceptable

问题是:汉语多出来的这个“若”是怎么回事呢?

再看:

       若价格在五十元左右还可以接受,那么什么价格不能接受呢?

可见,这个条件子句可以是结构歧义的,这时候“若”字就是地道的主从连词了。涉及的句型应该是:

       若-Clause [SubjClause+Pred],那么 MainClause

      SubjClause[若-CLause] + Pred


汉语碎片二:

同胞说话都是这样断断续续么?今天遇到的是这个句子:第一次网购这样的大件物品, 以后就有信心了.

第一个VP与第二个谓语VP啥关系?谁有信心可以不追究了,应该是“我”,不排除是你,或者泛泛而指。第一个VP背后的意思大概是下述这样的么,如果补全的话?

       【我】第一次网购这样的大件物品【因此免不了出偏差】,
        以后【我】就有信心【网购大件物品而不出差错】了。

形式裸奔也便罢了,内容省略居然可以达到如此地步! -- 我们人是怎么理解的?

百度翻译: For the first time such a large online shopping items, after the confidence.

谷歌翻译:The first big-ticket items such as online shopping, there is confidence in the future.

人工直译:first time online shop such a big item, in future will have confidence.

人工理解了再译大概是: It was my first time of buying such a big item online, I will have more confidence in such things in future.


白: 第一次网购那个例子,我有不同的解读:潜台词不是“难免有差错”,而是“风险较大心里没底”。“难免有差错”似乎差错是“已然”了似的,但从字面看不出“已然”的意思。

我: 是是。

那就不是:
       It was my first time of buying such a big item online, I will have more confidence in such things in future.

而是

       This will be my first time of buying such a big item online, (I am not sure I can do it well, but) I will have more confidence in future.

我实际的问题是,此类句子似乎汉语特别多见,模模糊糊,有话不说清楚,需要人去琢磨才能厘清。汉语NLP研发中经常见到这些让人哭笑不得的句子,可读上去大多很顺,国人可不就这么说话的嘛。谁会为了照顾我们机器NLU,就把话刻意说清楚呢?

伟大的中文,I 服了 U,这辈子奏跟丫拼了,偶。




【相关】


泥沙龙笔记:汉语牛逼,国人任性!

泥沙龙笔记:汉语就是一种“裸奔” 的语言

【泥沙龙笔记:从机器战胜人类围棋谈开去】

【新智元笔记:反伊莉莎效应,人工智能的新概念】

《立委随笔:人工“智能”》



【置顶:立委科学网博客NLP博文一览(定期更新版)】




https://blog.sciencenet.cn/blog-362400-961946.html

上一篇:什么专业好?
下一篇:【新智元笔记:强弱人工智能之辩】
收藏 IP: 192.168.0.*| 热度|

4 郑小康 徐令予 张珑 魏焱明

该博文允许注册用户评论 请点击登录 评论 (3 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-21 16:59

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部