《镜子大全》《朝华午拾》分享 http://blog.sciencenet.cn/u/liwei999 曾任红小兵,插队修地球,1991年去国离乡,不知行止。

博文

【deep parsing 小品:天涯若比邻的远距离关系】

已有 4419 次阅读 2016-5-31 22:40 |个人分类:立委科普|系统分类:教学心得| 句法, 逻辑语义, 远距离


notes 一哈:

1. “这个” 应该跟“房间”,而不是“(房间)衣服” ,可是“个”是万能量词,这个区分来自什么知识?

2. Next 应该是 O between “穿” and first NP “....衣服”,这个不难,是搭配,语义中间件可以搞定,利用 Next 桥梁。

3. 定语“穿” 目前逻辑语义的既是 S 又是 O 的结果在搞定 2 时候可以修正成 S:人 S - 穿 - 衣服 O(主谓宾)。

4. 这句里面,"进来“ 与 ”房间“ 的远距离关系是最难对付的,这是白老师出此题的精到的所在。最妙的是,即便挨着,我们一般也不说“进来房间”(是可以说,但有些勉强),而是句法词法搅合地说“进房间来”,何况这个 arg “房间”隐藏在第一个 NP 的内部做定语 Mod 或 话题 Topic。这几乎是考验NLU的句法极致了。赞一下白老师此句。4 暂时不指望做了。其余的都是脉路清晰可见可达,一步之遥而已。


远距离的 4 的关系,如果一定想做,我们可以看看在线性语句转化为平面树图以后,语义中间件里面,其距离到底有多远?

第一步:“房间”通过 Mod 到达 “衣服”

第二步:通过 Next 到达 “不允许”

第三步: 通过 OPred (动词性宾语成分)到达 “进来”

可见,即便如此复杂深奥的远距离关系,到了句法以后,相互距离不过是三步之遥:句法的 trigram 而已。可见句法之结构化的厉害。

数一数这个远距离在线性中的距离:

房间 -- 1 衣服 -- 2 穿 -- 3 得 -- 4 过于 --5  暴露 -- 6 的 -- 7 人 -- 8 不 -- 9 允许 --10 进来

换句话说,线性序列的 10-gram 一结构化就成了 3-gram。

古话说:海内存知己,天涯若比邻,信然。

因此 4 虽然从句法语义上看,差不多是最典型繁难的远距离自然语言理解的挑战的一个实例了,但实际上在句法核武器上了以后,还是有路径有希望的。不过是暂时放放,不强求立马去做而已。非不能也,是不为也,是语言学家的 fascinating 的例子,但不是NLU实用上最当紧的任务。

白老师出得如此绝妙好句,也是醉了。声称 NLU 的人有福了,or 有的做了。




【相关】


【新智元笔记:搭配面面观】 

【置顶:立委科学网博客NLP博文一览(定期更新版)】







https://blog.sciencenet.cn/blog-362400-981569.html

上一篇:【新智元笔记:工程语法与深度神经】
下一篇:【deep parsing 小品:谁的牛皮大,大家六一快乐】
收藏 IP: 192.168.0.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-24 07:10

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部