基于词汇开展信息计量研究的困惑
已有 4641 次阅读
2011-1-28 17:54
|个人分类:生活点滴|系统分类:科研笔记|
英文, 中文, 关键词, 同义词, 准确度
对词汇进行计量是一种典型的内容分析法,同时也是情报学常用的研究方法。
为了对词汇的频率和共现关系进行分析,必须首先收集文章关键词。
在传播学领域,内容分析常常要进行全文检索。在情报学领域,研究者则常使用文章的关键词,包括专家标引词或者作者提供的关键词,不管是那种来源,就会面临词汇归一化的问题。
Ding Ying曾对英文语境下的关键词归一化给出过范例,但是中文语境里,这个问题相对麻烦些,它不仅仅涉及到关键词数量和标引准确度的问题,还有同义词(词组)、中英文同义、缩写等问题。
已往,多数基于共词的研究都回避了这个问题,但事实上,这是共词分析的关键性环节,尤其是在数据量比较小的情况,信息失真相对严重。不解决这个问题,研究结果就是不严谨和不可靠的。
谁能给出个系统的解决方案呢?
https://blog.sciencenet.cn/blog-67855-408709.html
上一篇:
200年来中国社会关注焦点演变计量图下一篇:
检讨