|||
特征因子(Eigenfactor,中文名由任胜利老师提出)可能是09年以来最受关注的期刊评价新指标。一方面因为特征因子创新性的将学界热切期望的“引文质量”纳入测评范围,颇具理论价值。另一方面,汤姆森公司(SCI体系的掌控者)09年初已经将其作为新版JCR的指标,正式开始实际应用。
下面就特征因子的发展背景及部分性质进行一点讨论。
Garfield提出的期刊影响因子,已对科学发展产生了巨大影响。但随着研究的深入,影响因子也暴露出诸多缺陷:如易被人为操纵、统计错误、不能跨学科比较、选源标准问题以及对非英文期刊不公平等。另外,期刊影响因子隐含假设:在剔除论文数量因素后,期刊越多的被引用则其影响力越高。显然,此假设成立需要满足“所有引文重要性等价”的条件。但每条引文的重要性是否等价是值得讨论的,如在总被引频次相等的情况下,被《nature》或《science》大量引用的论文影响力显然会大于只被一些低水平期刊引用的论文。因此,要更为准确的反映期刊论文影响,还需考虑每条引文本身的价值。影响因子对于期刊的评价远非完美,理论上和实践上都需要更为准确的期刊评价指标。
Pinski等人提出以引用某论文的论文被引频次作为权,迭代计算引文加权重要性的思想。但限于计算复杂性,此思想鲜见实际运用。1998年,Google公司创始人Brin和Page提出PageRank算法,用类似于Pinski等人的方法,计算网页的重要性和进行网页排序,成为Google王朝的奠基之石。随着计算机性能的提升和PageRank算法的成功,研究者开始注意到将PageRank算法用于引文分析的广阔前景。
在这样的背景下,2007年,美国华盛顿大学和加州大学的Bergstrom等人组成的研究小组发布了一个新的期刊引文评价指标——Eigenfactor。与影响因子不同,Eigenfactor的基本假设是:期刊越多的被高影响的期刊所引用则其影响力也越高。Eigenfactor使用Thompson公司的Journal Citation Reports (JCR)为数据源,构建剔除自引的期刊5年期引文矩阵,以类似于 PageRank的算法迭代计算出期刊的权重影响值,实现了引文数量与价值的综合评价。这一新指标以期刊影响力为权,以更贴近实际的权重网络形式重构了最早由Price[16]提出的引文网络。其计算思想也与社会网络分析中用于描述节点在关系网络里权力和地位的特征向量中心度相似,重要的不同之处是Eigenfactor的算法避免了孤立点的影响。
Eigenfactor的部分特征包括:
1)同时测量了引文的数量和“质量”,理念上更为先进,理论假设更为合理,无视自引,并相对难以伪造。
2)其结果更好的体现了《NATURE》和《SCIENCE》等顶尖刊物的真实影响力和学术地位。
3)是一个总量性指标,与影响因子等篇均性指标差别明显,具有一些影响因子难以比拟的优点。当然,其派生出了论文影响分值(Article Influence Score)则是较典型的“篇均”性指标。
4)拉大了“好”期刊和“差”期刊的差距,但同时存在对于“差”期刊的区分度较弱的问题。
5)特征因子也有前述影响因子的一些缺陷,并且,特征因子和论文影响分值是目前JCR指标中的数据封闭性最强的指标。
一些后续的推测和讨论:
1)鉴于算法是带有“普遍联系”特点的加权,传统科学计量学中的一些规律可能不能在特征因子上很好体现,比如布拉德福分布等。
2)国外有学者[1]发现国际医学期刊的特征因子与总被引存在对数变换后的高度Pearson相关,因此认为两者并没有太大的排序差异。个人觉得有待讨论,Pearson相关性强仅代表宏观总体的数值同向变化,并不说明指标在微观上可相互替代或排序差异不大。当样本足够时,某一样本的位序改变会导致整个序列不同程度的“联动”。精确检验排序是否存在显著差异采用非参数检验的秩和类方法可能更适宜。另一方面,总被引次数和特征因子都是基于引文的期刊的正向评价方法,自然不会有结果上的较大差异,若存在这样的差异,则说明其中一种方法可能有误。
3)基于社会网络和复杂网络观点的科学计量与评价可能是今后的一个热点方向,特征因子可能成为其中里程碑之一,我们也有一些初步的学习[2][3]。
附件是于08年完成的相关学习,当时特征因子还未被汤姆森公司所使用,前景不明,时有忐忑。近期已有几位同行来信索要这篇文献,为方便交流,故贴出来,接受批评。
参考文献:
[1] Davis P M. Eigenfactor: Does the Principle of Repeated Improvement Result in Better Estimates than Raw Citation Counts?[J]. JOURNAL OF THE AMERICAN SOCIETY FOR INFORMATION SCIENCE AND TECHNOLOGY. 2008, 59(13): 2186-2188
[2] 陶乃航,赵星,彭晓东,翟伟希.中心度指标在期刊引文网络分析中的运用及改进.图书情报工作,2009,53(14):143-109
[3] 陈亦佳,赵星.基于期刊引文网络视角研究国际图书馆学情报学知识交流.现代图书情报技术,2009,25(6):55-60
更多阅读:
任胜利. 特征因子(Eigenfactor): 基于引证网络分析期刊和论文的重要性. 中国科技期刊研究, 2009, 20(3): 415-418
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-22 06:14
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社