ontheways的个人博客分享 http://blog.sciencenet.cn/u/ontheways

博文

期刊影响因子辨析 精选

已有 11909 次阅读 2016-5-17 09:01 |个人分类:期刊评价|系统分类:科研笔记| 期刊影响因子

本文(译文)发表在《数学译林》2009年第4期289-304页


如果第一次阅读本文,您可以先看:

引文统计局限性辨析


2 期刊排名:影响因子

(备注:本部分关注焦点虽然集中在Thompson Scientific(汤姆森科技集团)的影响因子,但我们也注意到汤姆森科技集团还在提倡使用其它两种统计指标。另外,对期刊来说,类似平均引文的统计数据也可从其它数据库获得,如Scopus,Spires,Google Scholar以及数学领域专用的《数学评论》引文数据库。后者包括2000年起至今总计超过400种数学期刊的参考文献,同时将其与《数学评论》1940年创刊以来的所有论文进行匹配,总量超过300万条引文。一原注)


影响因子等于期刊在特定时间发表论文的篇均引文[Garfield 2005]。期刊影响因子数据来自于汤姆森科技集团(前身为美国科技信息研究所)出版的《JournalCitationReports(期刊引文报告)》。汤姆森科技集团从9000多种期刊中抽取数据,每年将每篇文章及其参考文献的信息添加到数据库中。利用这样的信息,可以计算一篇文章发表后被数据库来源期刊所引用的情况(我们注意到汤姆森科技集团收录的数学类期刊的数量不及数学领域两个主要的综述类杂志《Mathematical Reviews((美国)数学评论)》和《Zentralblatt MATH

((德国)数学评论)》(译文中凡提及《数学评论》处,皆指(Mathematical Reviews》。当指《Zentralblatt MATH》时,会特别写为《(德国)数学评论》——编注)收录期刊总量的一半。(备注:汤姆森科技集团根据以下分类给出期刊的索引(March 2008):数学(217),应用数学(177),数学综合类(76),物理,数学(44),概率与统计(96)。以上的期刊分类是有重叠的,实际数学类期刊总量约为400种。通过比较发现,数学评论》每年涵盖了超过1200种期刊,其中,有800多种被认为是“核心”期刊(期刊的每篇文献都会收录在《数学评论》)。《(德国)数学评论》数据库收录的数学期刊数量大致与《数学评论》相同。——原注)


对于特定期刊和年份而言,期刊影响因子是指在给定年份之前的两年内期刊论文的篇均引文(引用期刊须被汤姆森科技集团收录)。例如:一种期刊在2007年的影响因子为1.5,这意味着它在2005-2006年发表的论文在2007年被汤姆森科技集团收录期刊引用的篇均频次为1.5。


汤姆森科技集团自已也在将影响因子作为要否给某些期刊做引文统计指数的遴选依据之一fTHOMPSON:SELECTION]。另一方面,汤姆森科技集团更倾向于将影响因子指标用于评价期刊。


"作为一种可用于图书馆期刊采购管理的工具,影响因子向图书馆管理者提供了已购或正在考虑购买的期刊的信息。这些信息应与期刊价格和流通数据结合起来考虑,才能作出期刊采购的合理决策。"『THOMPSON:IMPACT FACTOR]


许多研究者指出,期刊的学术价值不能仅通过引用数据来判断,现在的很多作者也非常赞同这样的观点。除此之外,人们对影响因子的批评还有其它的理由[Seglen1997],[Amin-Mabe 2000],[Monastersky2005],[Ewing 2006],[Adler 2007],和[Hall 2007]:


(i)作为一种平均数,影响因子的计算结果不尽合理。因为很多期刊发表一些非实质性的文章,如快讯或卷首语等。这类文章由于较少被引用,因此在影响因子计算时未计入分母。另一方面,这类文章也会被少量引用,而这些引用频次却被计入分子。由此可见,影响因子并不是每篇论文精确的平均被引频次。当期刊发表大量“非实质性”文章时,这种偏差将会非常显著。不过,在很多领域,包括数学,这种偏差并不显著。


(ii)影响因子的计算以两年为统计期是为了得到能够反映期刊近期状况的统计数据[Garfield 2005]。这对于某些领域,例如生物医学领域是恰当的,因为大多数论文在发表后就能够很快得到引用。但是在另外一些领域,例如数学领域,大部分引文都产生在两年后。对数学类期刊Mathematical Reviews Citation Database,《数学评论》引文数据库超过300万次引文的最新统计表明:约有90%的引文超出了两年的时间窗。因此,对数学领域期刊影响因子的计算是基于10%的引文,并没有考虑到大多数引文。


以两年为统计期计算影响因子是否会产生错误导向?就数学期刊而言这一点并没有确凿的证据。汤姆森科技集团计算了5年期的影响因子,数据表明,通常所用的两年期影响因子与5年期影响因子具有很强的相关性[Garfield 1998]。此外,利用《数学评论》引文数据库,分别以2年、5年和10年为时间窗,计算了100种高被引数学期刊的影响因子。结果表明:5年、10年期的影响因子,其曲线大体上围绕着2年期的影响因子波动。

(iii)影响因子因学科的不同而有很大的差异[Amin-Mabe 2000]。产生差异的部分原因可以通过对(ii)的观察得出:如果某些学科有很多引文发生在两年的时间窗之外,那么,这些学科期刊的影响因子就会很低。产生差异的另一部分原因是学科与学科之间存在不同的引文习惯,不同学科的科学家引用他人的论文也存在不同的频率和不同的原因(我们会在后面加以详细分析,因为引文的含义非常重要)。基于以上原因,对不同学科的两种期刊用影响因子进行比较是没有任何意义的。


(iv)影响因子因年份的不同而变化很大。对于发表论文数量较少的期刊而言这种可变性会更大一些[Amin-Mabe 2000]。例如2002-2003年发表论文数量在50篇以下的期刊,影响因子数值的平均变化在50%左右。这完全在意料之中。因为规模小的期刊其样本量就小。然而,人们经常在比较某一年份的期刊影响因子时,并未考虑到“小”期刊具有较高可变性这一事实。


(v)在通常情况下,非英文期刊得到的引文要少于英文期刊,因为科学共同体中有相当一部分科研人员不能读懂或不看这些非英文期刊。这类期刊的影响因子可能会因此受到影响,而这种影响与期刊质量没有关系。又如,发表综述性文章的期刊得到的被引频次要比发表一般性研究论文的期刊高得多,因此也会有较高(有时会出奇地高)的影响因子[Amin-Mabe 2000]。


(vi)对影响因子最主要的批评是其含义不易理解。当用影响因子来比较两种期刊时,并没有给出选优的模型来确定哪一种期刊更好。唯一的模型源自影响因子自身:影响因子越大,期刊就好。在经典的统计范式中,先定义模型,形成假设(无差异的),然后依据统计结果接受或拒绝假设。根据数据本身(可能是根据一种模型)获取信息是统计分析的合理方法,而这种方法究竟能够获得什么样的信息是不明确的。影响因子如何测度期刊的质量?它是最好的统计指标吗?这种测度精确吗(下面对引文指标含义的讨论与此有关)?显然,我们对期刊质量模型及其与影响因子的关系知之甚少。


以上对影响因子的6种批评都有据可查。不过,所有批评都只能说明影响因子比较粗糙,而不是无用的。例如,影响因子可以用作期刊分级排序的基础,也就是说可以利用影响因子来初步确定期刊的级别,然后再用其它指标进行精确排序并对分级期刊的内涵进行论证。然而,用影响因子评价期刊需要特别小心。它不能用于不同学科的期刊比较。例如,用影响因子排序时要考虑期刊的类型、要注意年份的变化,尤其是那些规模较小的期刊;要知道不同期刊之间影响因子的微小差异也许纯属随机现象。影响因子在某些学科并不能精确反映引文活动的全貌,认识到这一点很重要,因为并非所有期刊都被数据库收录,而且影响因子的统计时间窗太窄。总之,引文只是评价期刊的方法之一,还应当补充其它信息来综合评价(这是本报告最核心的观点)。


与任何基于统计数据的排序一样,谨慎态度是必须强调的。用影响因子对某年的期刊进行不理智的排序就是滥用统计数据。就影响因子的功用而言,汤姆森科技集团也赞同这一说法,认为在使用影响因子时还是小心为好。

“汤姆森科技集团并不是只用影响因子来评价期刊的有用性,还应该有其他的标准。如果对影响引文指标(如篇均被引频次)的种种现象不加仔细分析,就不应该使用影响因子。影响因子应该是为同行评议提供信息服务的手段。”[THOMPSON:IMPACT FACTOR]


遗憾的是,这一忠告常被人们忽视。




https://blog.sciencenet.cn/blog-755333-977639.html

上一篇:引文统计局限性辨析
下一篇:科研成果评价辨析
收藏 IP: 159.226.100.*| 热度|

8 许培扬 孟庆勋 喻海良 章雨旭 黄永义 吴世凯 孙颉 杨燕

该博文允许注册用户评论 请点击登录 评论 (5 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-22 21:58

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部