|||
问题的提出,是来自由科研的实践。
对于某个领域的高被引论文的同被引聚类分析,已经成为我们这里比较常用的情报分析手段了;但是,这里还有很多问题,妨碍着这个方法成为情报咨询服务中的常规项目。其中,用于对聚类结果的分析,一直在困扰这我们:对于属于同一个类别的高被引论文,如何提炼出这个类别的主要内容呢?换句话说,如何给聚类分配一个“类标签”?
我们现在的做法是人工阅读,靠分析者的专业知识和思维能力(分析综合),来归纳和分析同一个类文章的共同特点,不同类文章的差异之处,其结果自然是因分析者的专业水平和分析能力而有很大的差异了。
能不能自动分类?答案是现成的:能。
可以提取出来这些文献的特征词(如主题词),进行频次的统计;或者进行向量空间模型甚至可能是潜在语义索引 (LSI),应该会表现出聚类文献的特征的:同类文献的相似之处与不同类之间的相异之处。【也许可以把这些类作为节点通过类间的特征分析,形成网络结构呢】
问题是,一篇文献被引用,可能不是因为其论文中的主要内容,也可能不是因为发表时候的初衷,而是在后来的科学发展过程中,逐渐被认识到了某一个方面的重要性,因而这就存在了一篇论文为什么被引用的问题,或者说,通过引用的文献来分析被引论文,或者说,分析一下来源文献作者在引用时为什么要选择这一篇,而不是哪一篇?
带着这个问题,我查阅了文献。大致的从题目看,如果从引用者出发,关于引用动机的研究已经是比较成熟的话题了,都是从行为科学或者心理学的角度列出了引用者的动机等等。
而现在,人们更注重从被引文献本身来分析,深入到了“为什么要引用这个?而不是那个?”的问题,比如被引文的内容【与引文的主题相关性】、被引文的影响力【什么是影响力?】、可获得性以及文献的质量等等。
引文和被引文肯定是在主题上相关的,但是还可以细分,我关心的是发表当时的主题内容 ,与目前的论文在哪些主题上相关的。也就是说这些高被引论文的当前的影响力在哪里,或者这篇论文的现实意义是什么。
顺着这个思路走下去,我们自然而然地走到了被引频次预测的问题,这也是近几年来悄然兴起的一个小热点。目前预测的指标都是使用的文献的外部特征,比如发表期刊了,作者的单位了,甚至以前论文的被引次数了,能否成为大热门,窃以为还要看指标的提取,这其中最重要的还是如何把内容特征作为预测指标,因为只有内容才是这个学科以及这个学科文献活动的真正的动因。
下面是我找到的一些中外文献的标题,可以分成引用行为与引用次数预测两个互相联系的类别。有趣的是,有两篇中文文献是武夷山老师的。有一种深山采药,暮然回首,惊见石壁上刻着仙人足迹的感觉。
1. Can the highly cited psychiatric paper be predicted early?
2. Author-rated importance of cited references in biology and psychology publications
3. Author Judgements about Works They Cite: Three Studies from Psychology Journals
4. Citation Context versus the Frequency Counts of Citation Histories
5. CAB: Citation-Assisted Background
6. Citers’ Use of Citees’ Names: Findings From a Qualitative Interview-Based Study
7. The J-shaped distribution of Citedness
8. Models for Predicting and Explaining Citation Count of Biomedical Articles
9. The motivation for citing specific references by social scientists in Korea: The phenomenon of co-existing references
10. Does the human capital of teams of natural science authors predict citation frequency?
11. Predicting citation count of Bioinformatics papers within four years of publication
12. How Can We Investigate Citation Behavior? A Study of Reasons for Citing Literature in Communication
13. Semiometrics and Impact Calculations
14. Statistically significant papers in psychiatry were cited more often than others
15. The Multilayered Nature of Reference Selection
16. The Psychology of Referencing in Psychology Journal Articles
17. What do citation counts measure? A review of studies on citing behavior
18. 关于论文引用动机的问卷调查研究
19. 文献引用的可控与不可控
20. 引用(行为)模型的比较与研究
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-22 14:11
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社