王晓光分享 http://blog.sciencenet.cn/u/limer 武汉大学信息管理学院

博文

基于词汇开展信息计量研究的困惑

已有 4305 次阅读 2011-1-28 17:54 |个人分类:生活点滴|系统分类:科研笔记| 英文, 中文, 关键词, 同义词, 准确度

对词汇进行计量是一种典型的内容分析法,同时也是情报学常用的研究方法。
为了对词汇的频率和共现关系进行分析,必须首先收集文章关键词。
在传播学领域,内容分析常常要进行全文检索。在情报学领域,研究者则常使用文章的关键词,包括专家标引词或者作者提供的关键词,不管是那种来源,就会面临词汇归一化的问题。
Ding Ying曾对英文语境下的关键词归一化给出过范例,但是中文语境里,这个问题相对麻烦些,它不仅仅涉及到关键词数量和标引准确度的问题,还有同义词(词组)、中英文同义、缩写等问题。
已往,多数基于共词的研究都回避了这个问题,但事实上,这是共词分析的关键性环节,尤其是在数据量比较小的情况,信息失真相对严重。不解决这个问题,研究结果就是不严谨和不可靠的。
谁能给出个系统的解决方案呢?


https://blog.sciencenet.cn/blog-67855-408709.html

上一篇:200年来中国社会关注焦点演变计量图
下一篇:检讨
收藏 IP: 58.49.19.*| 热度|

8 许培扬 赵星 章成志 周春雷 刘钢 张利华 化柏林 理论思维

发表评论 评论 (21 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-19 06:48

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部