《镜子大全》《朝华午拾》分享 http://blog.sciencenet.cn/u/liwei999 曾任红小兵,插队修地球,1991年去国离乡,不知行止。

博文

泥沙龙笔记:在知识处理中,很多时候,人不如机

已有 2147 次阅读 2015-11-5 18:55 |个人分类:立委科普|系统分类:教学心得|关键词:ngram,词典,汉语| 汉语, 词典, ngram

谢:

中文太有意思了: Chinese is so difficult to learn." Said the lao wai.

大不一样    

    一美女兴致勃勃地问医生:“我想丰胸,但是丰胸后会有什么效果?”

    医生淡定地答道:丰胸后,一般会有四种结果:

    1. 大不一样;

    2. 不大一样;

    3. 一样不大;

    4. 不一样大!

    世界上没有其它的文字能够有这样的功能,中文万岁!

         

中文字的奥妙

    外国人学中文,确实不容易。中文字的奥妙,常常让学中文的老外晕倒,分享几个段子:

    一、方便

    一位刚学过一点中文的美国人来到中国,中国朋友请他吃饭。

    到了饭店落座,中国朋友说:“对不起,我去方便一下。”

    那老外没明白,“方便”是哪里?

    见老外疑惑,中国朋友告诉他说“方便”,口语里是“上厕所”的意思。

    哦,老外意会了。

    席间,中国朋友对老外说:“我下次到美国,希望你能帮忙提供些方便。”

    老外纳闷了:他去美国,让我提供些厕所干嘛?

    道别时,另一位在座的中国朋友热情地对老外说:“我想在你方便的时候请你吃饭。”

    见老外吃惊发愣,中国朋友接着说:“如果你最近不方便的话,咱们改日……”

    老外无语。

    “咱找个你我都方便的时候一起吃饭吧。”

     老外随即晕倒。


    二、乳

    一位老师向老外学生解释“乳” 字的含意:乳即是小的意思,比如乳鸽、乳猪等。

    讲解完,老师要求老外学生用“乳”字造句。

    老外学生造句说:“现在房价太高了,所以我家只能买得起20平方米的乳房。”

    老师听了,冒着冷汗说:“再造一个!”

    老外学生:“我年纪太小,连一米宽的乳沟都跳不过去。”

    老师冷汗如雨下,说:“再造一个!”

    老外学生说:“老师我真的想不出来了,我的乳头都快想破了!”


    三、意思

    某老外苦学汉语10年,到中国参加汉语考试。

    试题之一:

      请解释下文中每个“意思”的意思:

    阿呆给领导送红包时,两个人的对话颇有意思。

    领导:“你这是什么意思?”

    阿呆:“没什么意思,意思意思而已。”

    领导:“你这就不够意思了。”

    阿呆:“小意思,小意思。”

    领导:“你这人真有意思。”

    阿呆:“其实也没有别的意思。”

    领导:“那我就不好意思了。”

    阿呆:“是我不好意思。”

    这老外晕了,一头雾水。

    中文的“意思”太深奥了,于是他交白卷回国。


我: 那些让老外糊涂的说法 交给电脑大多容易。一词多义的双关语简单 因为本来的“词”或说法就是不同的ngram形式。可见,人的大脑真地不咋样,几个 ngrams 就给绕糊涂了,或者是联想过度的毛病。

譬如。关于“意思”的ngrams,只要当做不同的词条,绑架不同的词义,就搞定了,哪里来的那么多糊涂呢?

1 什么意思:想干什么

2 没什么意思:别多想

3 意思意思:略表心意

4 不够意思:不够朋友

5 小意思:不足挂齿

6 真有意思:真有趣

7 没有别的意思:真地没啥

8. 不好意思:不好意思

哪里有深奥,不就是记住 8 个 ngrams 么。记住了,爱怎么解释怎么解释,即便一个 ngram 有歧义,也不过就是绑架多个意思而已。

关于“方便”的ngrams也是如此。

这也说明了外语教学存在很大问题,该死记的,老师没让学生去死记,而是任凭学生秀才识字认半边,瞎联想,过度思维,不懂语言学里的词典强盗逻辑,不了解词义的黑箱绑定原理,也不懂词典就是一个垃圾箱,词条可以是任意的ngrams,包括各种习惯用法,成语、俗语、熟语、俚语和黑话等。

谢: 对于机器来说,不管场景多少,这种确定性的意义对于机器是容易的;但对于人,反而因为联想而歧义,因歧义而模糊,但翻过来也成就了人的想象力和创造力。


【相关】

贴身小蜜的面纱和人工智能的奥秘 2015-11-04

《立委科普:机器可以揭开双关语神秘的面纱》 2015-11-03

泥沙龙笔记:在知识处理中,很多时候,人不如机 2015-11-05

       NLP 围脖:成语从来不是问题

       NLP 历史上最大的媒体误导:成语难倒了电脑

      【置顶:立委科学网博客NLP博文一览(定期更新版)】







http://blog.sciencenet.cn/blog-362400-933587.html

上一篇:贴身小蜜的面纱和人工智能的奥秘
下一篇:对付成语电脑是大拿,非成语现象呢?

3 陆泽橼 王林平 陈南晖

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备14006957 )

GMT+8, 2019-3-23 21:38

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部