随园厚学分享 http://blog.sciencenet.cn/u/gothere 计算语言学博士 希望在这里留下学术的足迹

博文

处女作《动宾搭配的语义分析和计算》出版啦

已有 5687 次阅读 2012-8-4 21:03 |个人分类:Computational Linguistics|系统分类:论文交流| 处女作, 动宾

虽然出版了已经半年了,但是自己尚未发博,趁着奥运之焦躁,补充一下。
出版的心情是欣喜的、纠结的。欣喜自不必说,纠结在于书的内容并非那么完美,很多问题没有深入挖到根,文字表述上还缺乏功力。
我的这本小书计算的部分不多,主要在后面两章;前面主要是理论阐述、数据标注和分析。全书的核心问题是想阐明动词对宾语的选择限制到底是语义类的,还是语 义属性(特征)的,还是其他的什么要素;重点做的是动宾搭配的理解问题。因为,宾语通常呈现出开放性,这在第三章有基于HowNet的详细调查。通过分析1460个动词及其搭配,总结出了动态性、主观性和认知事件框架三个要素。比如,传统上认为“问题”是一个语义类,可是除了典型的一些词语“难题”、“困难”之外,“住房”、“入托”、“温饱”等词都是一种动态认定的或者默认的难题。借用认知语言学的观点,一个事物是否是“问题”,完全在于语言使用者在语境中的动态认定(profile)。这样就回答了为何静态的语义知识库难以满足动宾搭配识别的问题。第四章,则尝试扩展Fillmore的框架语义学理论,以汉语动宾搭配实例的分析,构建新的语言模型。比如,动词“当心”的宾语有两类,一类是保护的对象,如,钱包,脑袋;一类是威胁物,如,石 头、骗子。这在现有的语文词典中没有得到区分,在语言理论上也都作为“受事patient”。而使用Fillmore的框架语义学理论则区分得很漂亮。但 Fillmore的理论尚未关心框架元素之间的认知关系问题。我在这一章中介绍了两大类常见的认知关系,“宿主-属性”关系和“容器-内容”关系。这些关系,可能就是人的一些基本的认知方式。另外,还探讨了“排火车票”这样的特异搭配,认为是“排队”和“买火车票”的叠加。这些分析,目前还没有建立好计算模型,但自己感觉解释力比较不错,有拓展空间,当然难度也比较大。 这方面我也有一个很大的疑惑,就是国内的论文经常提“概念的叠加”,但始终没有进行论证,与“blending theory”到内涵又不同,不清楚是何缘故。
    第五章的褒贬指向,则把传统的褒义词、贬义词的说法进行细化,算是个小小的创新。比如,“夸奖”是施事褒扬受事,“包庇”则是说话人贬低施事和受事。通过分析900多个词语,确定每个褒贬词语究竟褒贬哪些语义角色,对动宾搭配而言也更具有指导意义。因为传统研究中,很多论文认为“包庇”的宾语一定是贬义词,现在看确实是不准确的表述,应该是说话人贬斥的对象。这也是动词静态要求和说话人主观性认定的体现。
    第六章我做了一个有意思的尝试,利用动宾之间的选择限制、相关词、词语相似度方法,寻找常见转喻(也就是借代)的本体,实验得到了不错的结果。但只能做到 显著度比较高的借代的理解。第七章的内容则比较简单些,仅仅是利用crf对“像”的比喻和非比喻用法进行分类,识别本体、喻体和相似点,也是对认知事件框架自动识别的一个个案研究。

下图是自己设计的老土封面,出版社没有采用,但是体现全书思想,发上来留念




还有些想法,未完待补……



https://blog.sciencenet.cn/blog-39714-599063.html

上一篇:用学习汉字的方式来学习英语——中国人学英语的三大误区
下一篇:2012语言学奥林匹克闭幕-中国队首次出战成绩不佳
收藏 IP: 183.208.12.*| 热度|

9 黄富强 许海云 赵凤光 陈筝 章成志 黄国平 杜永明 吕鹏辉 龚鹏飞

该博文允许注册用户评论 请点击登录 评论 (11 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-26 19:41

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部