《镜子大全》《朝华午拾》分享 http://blog.sciencenet.cn/u/liwei999 曾任红小兵,插队修地球,1991年去国离乡,不知行止。

博文

一日一parsing:“宝宝的经纪人睡了宝宝的宝宝 ..."

已有 7006 次阅读 2016-8-15 00:50 |个人分类:立委科普|系统分类:教学心得| parsing, 中文句法分析

bai:
宝宝的经纪人睡了宝宝的宝宝,宝宝不知道宝宝的宝宝是不是宝宝亲生的宝宝,宝宝的宝宝为什么要这样对待宝宝!宝宝真的很难过!宝宝现在最担心的是宝宝的宝宝是不是宝宝的宝宝,如果宝宝的宝宝不是宝宝的宝宝那真的吓死宝宝了。

tan:
这种八卦,估计很难分析。 难为parse这个宝宝了!

姜:
里边的歧义真是不少啊!要仔细用心才能理解每个“宝宝”的含义!
宝宝1:王宝强;宝宝2:王宝强媳妇;宝宝3:王宝强媳妇的儿子;宝宝4:王宝强的儿子

我:
结构上看还是蛮清晰的,有些人看上去类似绕口令的话语,结构分析的挑战其实不大

0814a

0814b

0814c

刘:
@wei 这主要不是parsing的问题,主要是指代消解的问题

我:
是的,我是说parsing提供结构的基础不难, 语义模块怎么消解指代是另外的问题。很多人以为这玩意儿没法 parsing,是因为对句法和语义的模块和功能不甚了解。当然一般人心目中的 parsing 等于 understanding,是结合了句法、语义甚至语用的整体的系统。
一步一步来吧。打下一个坚实的结构基础总是有利的。
我是 native speaker,其实也看不懂,不知道里面宝宝指的都是谁。刚才上网恶补了一下新闻,才明白怎么回事儿。所以,这里的指代消解需要很多语用背景知识,光句法语义分析不能解析的。

白:
这么快段子就来了:王宝强去马场选了一匹马准备骑,这时候马场的师傅阻止了他,说选的这个马不好。宝强问为啥?师傅解释说:“这马容易劈腿。” 宝强没有听太明白,师傅又大声说:“这马蓉易劈腿啊!!”🌚

我:
这是白老师先前转的,还是也 parse parse 凑齐一段吧:

814d

814e

814f

雷:

宝宝的宝宝是宝宝的吗?

我:

最多也只能提供可能性,然后语用或背景知识去定。

从词典上,“宝宝(Baby)”的可能性是:(1)孩子;(2)爱人

至于宝宝指王宝强,那是抽风似的娱乐界当前的背景知识,此前此后都没有这个知识。

白:

名字里带“宝”字的都有可能

之前宝宝的称号还被赋予过仰望星空那位大人物 是有先例的

我:

这样每一个宝宝就有三个义项: 宝宝1 (孩子),宝宝2 (爱人),宝宝3 (宝强)

孩子的孩子是孩子吗

爱人的爱人是爱人吗

宝强的宝强是宝强吗

孩子的爱人是孩子吗

孩子的爱人是爱人吗

孩子的爱人是宝强吗

孩子的宝强是孩子吗

孩子的宝强是爱人吗

孩子的宝强是宝强吗

爱人的孩子是孩子吗

爱人的孩子是爱人吗

爱人的孩子是宝强么

.........

总之,逃不过这些爆炸的组合之一

加一点限制条件可以排除一些不可能组合,

但留下的空间还是远远大于可以离开新闻背景知识而能消解的可能。

雷:

还有,现在还流行自称“宝宝”,比如,宝宝不高兴

白:

没那么复杂。“【孩子】是【男人】的吗?”才是唯一有看点的提问。其他都是渣。

我:

人不看新闻也解不了,反正我第一次看,完全不知所云。

雷:

还有,宝马之争

我:

宝强的孩子是宝强(亲生)的吗

雷:

宝强的老婆是宝强的吗?

我:

恩,这两条是关键,怎么从成堆的渣里面提炼出这两条?

我:

通过什么样的知识?

这不是新闻背景知识了,这是人类道德在现阶段的扭曲和窥探欲的某种知识

白:

不是窥探欲的问题,是信息量、冲击力大小的问题。

雷:

孩子的爸爸是孩子的吗?

我:

孩子的爸爸是孩子的吗? 这个可能只在想象中成立,想象孩子把自己的爸爸叫做宝宝,孩子有这种探究的动机,等。

雷:

第三方看,也是可以的



【相关】

【立委科普:语法结构树之美(之二)】


关于 parsing

【关于中文NLP】

【置顶:立委NLP博文一览】

《朝华午拾》总目录




https://blog.sciencenet.cn/blog-362400-996472.html

上一篇:S. Bai: NLP Caterpillar Breaks through Chomsky's Castle
下一篇:科普小品:从汉语Topic句式谈起
收藏 IP: 192.168.0.*| 热度|

9 苏德辰 王天一 吕喆 陈辉 李志俊 bridgeneer zhucele gaoshannankai yangb919

该博文允许注册用户评论 请点击登录 评论 (6 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-7-25 03:23

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部