虽然出版了已经半年了,但是自己尚未发博,趁着奥运之焦躁,补充一下。
出版的心情是欣喜的、纠结的。欣喜自不必说,纠结在于书的内容并非那么完美,很多问题没有深入挖到根,文字表述上还缺乏功力。
我的这本小书计算的部分不多,主要在后面两章;前面主要是理论阐述、数据标注和分析。全书的核心问题是想阐明动词对宾语的选择限制到底是语义类的,还是语
义属性(特征)的,还是其他的什么要素;重点做的是动宾搭配的理解问题。因为,宾语通常呈现出开放性,这在第三章有基于HowNet的详细调查。通过分析1460个动词及其搭配,总结出了动态性、主观性和认知事件框架三个要素。比如,传统上认为“问题”是一个语义类,可是除了典型的一些词语“难题”、“困难”之外,“住房”、“入托”、“温饱”等词都是一种动态认定的或者默认的难题。借用认知语言学的观点,一个事物是否是“问题”,完全在于语言使用者在语境中的动态认定(profile)。这样就回答了为何静态的语义知识库难以满足动宾搭配识别的问题。第四章,则尝试扩展Fillmore的框架语义学理论,以汉语动宾搭配实例的分析,构建新的语言模型。比如,动词“当心”的宾语有两类,一类是保护的对象,如,钱包,脑袋;一类是威胁物,如,石
头、骗子。这在现有的语文词典中没有得到区分,在语言理论上也都作为“受事patient”。而使用Fillmore的框架语义学理论则区分得很漂亮。但
Fillmore的理论尚未关心框架元素之间的认知关系问题。我在这一章中介绍了两大类常见的认知关系,“宿主-属性”关系和“容器-内容”关系。这些关系,可能就是人的一些基本的认知方式。另外,还探讨了“排火车票”这样的特异搭配,认为是“排队”和“买火车票”的叠加。这些分析,目前还没有建立好计算模型,但自己感觉解释力比较不错,有拓展空间,当然难度也比较大。
这方面我也有一个很大的疑惑,就是国内的论文经常提“概念的叠加”,但始终没有进行论证,与“blending
theory”到内涵又不同,不清楚是何缘故。
第五章的褒贬指向,则把传统的褒义词、贬义词的说法进行细化,算是个小小的创新。比如,“夸奖”是施事褒扬受事,“包庇”则是说话人贬低施事和受事。通过分析900多个词语,确定每个褒贬词语究竟褒贬哪些语义角色,对动宾搭配而言也更具有指导意义。因为传统研究中,很多论文认为“包庇”的宾语一定是贬义词,现在看确实是不准确的表述,应该是说话人贬斥的对象。这也是动词静态要求和说话人主观性认定的体现。
第六章我做了一个有意思的尝试,利用动宾之间的选择限制、相关词、词语相似度方法,寻找常见转喻(也就是借代)的本体,实验得到了不错的结果。但只能做到
显著度比较高的借代的理解。第七章的内容则比较简单些,仅仅是利用crf对“像”的比喻和非比喻用法进行分类,识别本体、喻体和相似点,也是对认知事件框架自动识别的一个个案研究。
下图是自己设计的老土封面,出版社没有采用,但是体现全书思想,发上来留念
还有些想法,未完待补……
https://blog.sciencenet.cn/blog-39714-599063.html
上一篇:
用学习汉字的方式来学习英语——中国人学英语的三大误区下一篇:
2012语言学奥林匹克闭幕-中国队首次出战成绩不佳