《镜子大全》《朝华午拾》分享 http://blog.sciencenet.cn/u/liwei999 曾任红小兵,插队修地球,1991年去国离乡,不知行止。

博文

【泥沙龙笔记:依存语言学的怪圈】

已有 4500 次阅读 2016-4-15 13:32 |个人分类:立委科普|系统分类:科普集锦| 依存关系, DAG

今天在思考死循环的问题。这是一个逻辑问题,也涉及语言学怪圈trigger 是所谓的父子原则:【科普小品:文法里的父子原则子曰,君君臣臣,父父子子。纲常不可乱。当然乱的也有,下面的故事便是。



Nick: @wei 我现在要上班,等周末空下来和你掐这个。

我先扯着,等@Nick  有闲批判。

咱东土生人可能一直在骨子里信奉孔孟之道,或者下意识受他老人家影响,所以做语言学一直严遵父子原则,直到进入逻辑理性,才发现这玩意儿不好使,也不神圣,绝对不是不可触犯的天条。

数据结构里面的 dag 说的是一种图的模型化,里面有两个要点,一是 d,就是纲常:臣忠于君,子听命父,天经地义。第二是 a,说的就是不能死循环。前例 “所以我就是我自己的外公”,就是犯了这个循环的错。局部看,每一个关系都是合理合法的婚姻,但绕着绕着,我成了自己的外公,就不像话了,数据结构dag就不答应。可是到了依存关系的定语从句,结构也傻了,根本连弯儿都没绕,直接进入循环怪圈:


尼克喜欢冰冰,SVO 没问题,可是做了定语以后就麻烦了:喜欢和冰冰直接进入死循环,绕不出来。尼克是局外,根本干着急。喜欢是冰冰的定语从句(Mod-S),冰冰是喜欢的对象宾语(O),这可怎么是好?乱了纲常,天诛地不灭,还活着。
忘记当年怎么写 specs 给的工程师了,总之是一切的 circular links 都挡住了,就是给“喜欢-冰冰”开了后门,大概是喜欢的太多了,与其气死尼克,不如让粉丝都进入死循环。语言学上讲,其实这个也不算循环,至少乔老爷不这么看。

乔老爷的短语结构文法(PSG)有个 X-bar 理论 按照他的理论,这个死循环就活了。不错,老子喜欢的逻辑宾语儿子的确是冰冰,但冰冰(作为)老子的定语儿子却不是喜欢,而是喜欢的杆杆,可能是杆杆杆,总之不是喜欢。X 杆杆理论说,喜欢不过是V(杆都没有呢,词一级的语言学单位)。喜欢的第一个杆叫做 VG (V-bar, Verb group,块组的语言学单位),喜欢到了加二道杆的时候叫 VP(V double bar,短语的语言学单位),该短语由喜欢与空降过来的冰冰构成(动词与其 internal args 构成两道杆的衔)。喜欢晋升到三道杆的时候就成了句子(V triple bar,S,or IP,这最后一个术语纯粹是语言学家玩的游戏,不论),作为定语就叫定语从句。既然是句子S,一般是主谓宾俱全的,没有尼克这个主语(external arg)作为句子是站不住的。因此,乔老爷的说法是,以喜欢为代表句子做了冰冰的儿子,修饰她服务她。而逻辑上呢,冰冰又被拉进了这个定语从句内部,做了里面大爷喜欢的儿子(or 女儿)。

总之这么一个理论上一摆弄,加了几个杆杆,乔老爷就克己复礼了。原来是从句作为一个整体做儿子,而儿子的老子冰冰只是又做了从句里面的个体喜欢的儿子(或女儿)。白马非马,此喜欢非彼喜欢,此喜欢的老子不妨做彼喜欢的儿子,老子虽高高在上,也不妨关起门来做儿子。
看到这里,如果还没晕,那你真是块语言学家的材料,入错行了,如今不幸做了CXO,老板,创业鬼,程序猿,或者是一不留神做了风投大爷。总之是可惜了您语言学家的天分。

还要加一句,才能稍微明白一点:乔老爷的结构树叫短语结构(phrase structure)树,我们树上画的基本上是属于依存关系(dependency)文法理论。不同的理论模型,角度不同,表现就不同。这个我的博文 【科普小品:文法里的父子原则】里有详解。总之循环出现在以词为终结节点(terminal nodes)的依存关系句法树上,到了短语结构句法树就不死了,因为用了杆杆把句子机构化为不同的非终结节点(non-terminal nodes),“人为”消除了死循环。乔老爷的把戏图示如下。


陈: @wei 能不能开放你的东西让我们做点应用?否则你说的越多,我们越着急
雷: 呵呵,馋死人不犯法
陈: @雷 只能选择性忽略了
雷: 呵呵,同感同感
我: 怎么开放呢?我说了不算啊。
雷: @wei 弄一个网站,大家一起玩
陈: @wei 属于全人类,不是一个资本家。告诉他
雷: 不需要处理整篇,句子就可以。大家集思广益,都来贡献各自的独特句子。
我: 不贵啊,超不过一个亿,谁有钱就买了做公益吧。不砍了,回家吃饭,据说有美食。下次看心情接着侃循环。
雷: 真不贵
陈: 宁愿一亿给你
雷: 就是,将伟哥挖出来,一个亿的给!成立一个伟哥研究院
陈: viaga research institute
雷: 我们就朝着这个方向努力,把伟哥挖出来。这群藏龙卧虎的,想做的事定能实现!
是缘: 把伟哥资产证券化,大家认购。
雷: 这不,出措施了
我: 唉,人不能成为饭桶啊。本来想乘兴把这个语言学数据结构的循环的故事讲得深透一点, 结果回家饱餐一顿家常中华料理以后,就忘了哪儿哪儿了。早上开车上班的时候还觉得有一肚子演义呢。
雷:  莫急,慢慢就又出来了,我们等。
张: jobs说stay hungry原来是这个意思

我: 他还说过 stay foolish,悲天悯人呢,那是因为饱食者太笨了,饿其体肤者太聪明,不笨一些,这个世界就没有饭桶的活路了,jobs 菩萨心肠啊



【相关】


【泥沙龙笔记:NLP hard 的歧义突破】


 【科普小品:文法里的父子原则】

 乔氏 X 杠杠理论 以及各式树形图表达法


【置顶:立委科学网博客NLP博文一览(定期更新版)】 





https://blog.sciencenet.cn/blog-362400-970278.html

上一篇:【朝华午拾:那一天是个好日子】
下一篇:【deep parsing:植树为林自成景(30/n)】
收藏 IP: 192.168.0.*| 热度|

1 闫钟峰

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-27 10:34

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部