《镜子大全》《朝华午拾》分享 http://blog.sciencenet.cn/u/liwei999 曾任红小兵,插队修地球,1991年去国离乡,不知行止。

博文

【新智元笔记:关于汉语介词的兼语句型,兼论POS】

已有 1895 次阅读 2016-1-25 11:23 |个人分类:立委科普|系统分类:教学心得|关键词:介词,副动词,汉语句法,逻辑语义| 逻辑语义, 汉语句法, 介词, 副动词

白: 遇到一个问题:“自我调节”、“自我修复“等当中的“自我”是什么词性?当说“进入自我修复的阶段”时,“自我”是定语吗?当说“进行自我调节”时,“自我”是状语吗?
我: 二者看不出不同,可以认为都是状语。对于小词,词性的命名并不重要。 小词的pos基本上是纯粹为了方便,无一定之规。一个小词的类别包含三五个词,还是几十个词,有很大的任意性。反正小词的类别是强盗绑架、词典枚举,系统内部协调方便即可。这与开放词类别不同。
宋: 指称语的修饰成份是定语,阵述语(述谓语)的修饰成份是状语。上例中,自我调节和自我修复好象都是述谓语,所以两个自我都是状语。
白: “按照证监会部署”当中的“证监会”是定语吗?为什么?
我: again 关系命名不重要。
白: 这次没有小词
我: 按照+NP+Pred,是一种确定的pattern,有对应的关系语义。在这个 pattern 里面如何命名 NP 与 Pred 之间的句法关系的名称不重要。逻辑上 NP 是 Pred 的施事,句法上,这个 pattern 可以在中间加 “的”(句法定语的典型标志)而不改变逻辑语义,所以如果说不加“的”也是定语,也未尝不可。
宋: 我掉进白硕设下的陷阱里了。问题的关键在于,一个小句由指称语加陈述语组成,但更深层的结构如何区分指称和陈述,以及是否需要做这种区分,还需研究。
我: 如果有人说 NP 是“按照”的兼语,也未尝不可。句法的命名没有一定之规,也是方便原则。重要的是,无论怎么命名,一个句式(pattern)所对应的逻辑语义应该是确定性的。汉语介词(又叫“副动词”)与动词没有明显界限,如果动词可以带“兼语”,那么“按照”(一般认为是介词)采用兼语式的这种说法,也是可以说得通的。如果说是定语,则“按照”就与其他的介词一致,句法上只需要一个介词宾语的坑,但是这个宾语坑要求动词充当,并且它的逻辑主语通常也是出现的,无论加“的” 还是不加“的”。
白:
 
遵循,跟随,陪同,邀请,......逐渐就演变成兼语了
我:
 
是的,可以看出连续性
,从虚化一点的副动词到一般动词
汉语语法研究中,经常看到为命名而争论
而忽略了其对应的逻辑语义的实质
常常是不毛之争
。其实
大多是 system internal 的协调问题,没有什么理论意义,也没有多少实践指导作用。兼语也就是个命名,类似的英语文法就不用这个术语,而直接说宾语(但其实有两种不同的宾语,一种是后面必须带宾语补足语的,一种是宾语就足够了的)
但无论怎么命名,关键还是一个 verb pattern or prep pattern 如何 map 到逻辑语义,这才是
句法
的实质。
白:
 
一头是倾向于“介词性”,好像说了半句话;一头倾向于“兼语性”,更加自足。英语,make him cry
我:
 
英语有形态,所以采纳“兼语”这种明显违反依存关系的句法原则(一个儿子最多有一个老子)的说法,一般认为不足取,但仍然不会改变其到逻辑语义的映射,因为后者是语言共性。譬如
We asked John to come.
We asked that John come.
这是两个明显不同的 subcat verb patterns, 前者是 V+NP+Infinitive;后者是 V + (that) + S (subjunctive in the form of original verb form),这样就凸显了形态语言的句法依存关系原则,前者 John 是宾语(对应宾格 him),后者是主语 John (对应主格 he)。而且后者从句不能用词尾 -s 来与主语保持第三人称单数的一致,因为从句不是陈述式。可是逻辑语义是宇宙一致的。在英语有这样两个 patterns 来对应(当然有 nuance 细微差别),而在汉语因为缺乏形态,结果变成了一个 “兼语”句式。这种跨语言的句法对比很有启发性。总之,句法的系统带有很强的任意性,内部统一和协调就好。没有对与不对的硬性标准,只要逻辑语义映射对了就好了。
白: 这个“按照”是不是介词?“他们发表这个声明,没有按照正规流程。”
我: 最好是把介词与动词看成是一个大类别里面的两个子类,然后根据不同分布随时让介词可以充当动词谓语,如上例。而介词默认是做状语。这样处理就避免了词性标注的争论。
NLP 历史上,POS 作为一个独立任务,有模块化的好处,有历史的进步意义。但 POS 分割出来以后,加上毛病多多的 PennTree 标准的流行,实际上造成了极大的误导。更由于这个领域里面主导的都是统计出身的人,普遍缺乏语言学的准备,对POS做机械解读,本末倒置,成为领域中一个很突出的问题。
白: “张三找李四去自首”有几重歧义?
我: 白老师打一枪换一个地方,是在挖坑么?我不怕上钩,就随风而舞,胡喷?
白: 到处都是坑,相当于没坑。

我: 本来以为就是兼语,逻辑语义上,“李四”是“去自首”的施事。没想到我的 parser 不知何时被我教导走了另一条路,想想也对:


因此至少有两个解读了。“找李四”于是成为一种方式或陪伴状语 (adverbial of manner or accompanying attendance)。不知后者是否有些勉强?
白: 不勉强。非常正确。
我: 那我是歪打正着了,已经记不得什么时候教给机器那一招了。所以我说,如果你不断教机器学文法,总有一天它突然会出乎设计者的意料地做出某种设计者自己第一眼也看不出的解读来。机器的记性太好了,memory 容量太大。老师可以忘记,学生却不会。
白: 方式一解,李四是自首的对象,“找李四”相当于“向李四”。陪伴一解,李四是行为的共主,“找李四”相当于“同李四“。所以一共有三重歧义。
我: 是,一种兼语,两种状语。
白:

【相关】

【新智元:中文 parsing 在希望的田野上】 

【立委科普:语法结构树之美(之二)】

【征文参赛:美梦成真】

【置顶:立委科学网博客NLP博文一览(定期更新版)】  





http://blog.sciencenet.cn/blog-362400-952378.html

上一篇:【新智元笔记:parsing 的鲁棒比精准更重要】
下一篇:【新智元笔记:再谈舆情的抽取挖掘】

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备14006957 )

GMT+8, 2019-10-23 00:18

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部