|||
作者合作视角下的h指数计量方法:比较与归纳
杜建,张玢
(中国医学科学院医学信息研究所 北京 100005)
摘要:在“大科学”时代背景下,表征科研合作规模的期刊论文作者合作度日益增大。然而当前国际上应用较多的学术影响力评价指标,如被引次数、h指数、g指数等均把“针对作者的引用次数”等同于“针对论文的引用次数”,而实际上各个作者在合作研究中的贡献是不同的,这尤其对多作者合作研究成果的评价“有失公允”。针对于此,学界的努力主要是考虑多作者合作问题对h指数进行修正,提出了一些新方法或新指标。本文对作者合作视角下被引次数、h指数等评价指标的计量方法进行全面系统的梳理,归纳比较了“均分作者荣誉”、“考虑主要贡献作者”和“计算和作者权重”3种观点的优势与不足。以期为优选较为科学合理的作者合作视角下h指数的计量方法提供基础。
关键词:作者合作;作者合作度;被引次数;h指数;科研评价
发表于《图书情报工作》2011年24期。
1 引言
2007年,Science杂志报道了一项对过去50年间1,990万篇论文和210万条专利中的作者合作状况的研究,指出多作者合作越来越成为现代科学技术中知识产出的主流趋势[1]。同年,Greene M在Nature上撰文指出,目前科研合作规模一直保持不断扩大,在一些学科领域(如基因组学、蛋白质组学、气候建模、粒子物理学等),多作者合作已经危及到了学者的荣誉分配体系。单作者的论文几乎已经消失了,在数学之外的大多数学科领域,越来越少的学者能够掌握足够的知识和技能独立完成重要的科学研究[2]。
然而当前国际上广泛应用的学术影响力评价指标,如被引次数、h指数、g指数均未考虑到多作者合作的问题,均把“针对作者的引用次数”等同于“针对论文的引用次数”,而实际上各个作者在合作研究中的贡献是不同的。Hirsch在提出h指数时就已经考虑到了这一点,他认为h指数的缺陷之一就是没有考虑到多作者合作[3]。同时,一些学术型的检索系统(如Web of Science、Scopus、Google Scholar)在统计被引次数和h指数时也没有考虑到作者在论文中不同的贡献度,这尤其对于多作者合作研究成果的评价“有失公允”。针对于此,学界的努力主要是基于作者合作对h指数进行修正。其中,国内文献仅见周春雷在2009年以《科学计量学》杂志(Scientometrics)的发文作者为例对h指数合作式注水的缺陷与对策进行简单探讨,且属于对社会科学学者的研究,得到的结果和结论并不适用于自然科学[4]。国外文献中不少学者均从不同角度提出了新方法或新指标。为全面反映该领域的研究现状,本文通过系统梳理,分析比较并归纳不同学者的思想和观点,以期为优选较为科学合理的作者合作视角下h指数的计量方法提供基础。
2 科研合作及其测度
科学研究中的合作关系在20世纪50年代就受到了关注,当时学术界一致认为多作者和多地址文献是计量科研合作活动的基本单元,合著文献的增多被认为是科学合作增长的一个标志[5]。史密斯(M. Smith)是探索多作者文献增长的研究者之一,他认为合著论文可作为研究小组间合作的计量指标[6]。普赖斯(S. Price)也提倡运用科学计量学方法研究科学合作的变化,并证实了史密斯关于科学研究中合作关系不断增加的结论[7]。
为衡量作者的合作规模,科学计量学界引入了期刊论文的作者合作度(co-authorship degree)的概念,即以人为单位对期刊论文的作者合作规模进行度量,一篇论文的作者个数即为该论文的作者合作度[8]。如今科研合作已经演变成为更大规模的作者合作(mega-authorship或hyper-authorship)[9,10],平均每篇论文的作者合作度越来越高,十几个甚至上百个作者也司空见惯。例如,在高能物理领域,80-200位作者甚至更多作者的合作论文已经比较普遍[11]。在生物医学研究领域,从研究设计、实验操作、结果报告到论文撰写均由一个人承担的现象已经不存在了。医学文献中作者的数量从17世纪60年代晚期到1920年的单个作者,已迅速增长到如今的多作者(multiple authors),甚至某些情况下论文署名行中数百个作者[12]。随着生物医学研究中作者的合作现象越来越显著,研究群体越来越大,多作者合作的趋势也仍在继续。因此,作者合作研究成果的贡献度评估和荣誉分配问题成为近年来科学计量学和科研评价领域讨论的热点主题。
3 学者观点的比较与归纳
目前,有关作者合作视角下的h指数的计量方法主要有均分作者荣誉、考虑主要贡献作者和计算合作者权重3种观点,其中包括浙江大学医学信息中心胡小君(X J Hu)及天津大学生命科学与工程研究院张春霆(C T Zhang)院士的研究成果。详细信息见表1。
3.1 均分作者荣誉
h指数的定义是,某作者发表的所有文献中,有h篇论文的被引次数至少为h次[13]。作者合作视角下通过均分作者荣誉对h指数进行的修正主要包括:①直接对h指数进行平均;②对论文数或被引次数进行平均,“平均”所用的分母均为论文的作者合作度。
3.1.1 h指数平均
Batista等人在2006年提出了hI指数,即作者的传统h指数值除以该作者纳入h指数的所有论文的平均作者合作度(篇均作者数) [14]。若某作者是一个庞大团体中的一员(例如高能物理领域、大规模流行病学调查领域、人口统计学领域),则通常是用该作者的传统h指数值除以其发表论文的作者数的中位数。
3.1.2 “分数式”计量
通过采用每篇论文作者合作度的倒数乘以论文数或被引次数的方式对论文数或被引次数进行“分数式计量”(Fractional counting),主要的代表人物及其观点如下。
(1)hm指数
不直接对h指数进行平均,Schreiber在2008年提出了一个更为精确的计算方法。每篇论文的被引次数都取该论文的合作度的倒数乘以该论文的实际被引次数,即hm指数 [15,16]。具体计算方法为:将某学者的论文按被引频次从大到小排列,从第一篇论文开始逐次累加每篇论文的作者合作度的倒数,直至累加值大于其对应文献的被引频次为止,该累加值的上一个累加值便是该学者的hm指数。并通过对8位物理学家的分析,结果显示这种方法与传统的h指数的排序有很大区别[17]。说明作者合作是一个对h指数有影响的重要因素。
与hm指数类似,Egghe在2008年提出被引次数和论文数都可以根据论文的作者合作度进行“分数式”计量,因此会产生两个分数式计量后的h指数和g指数[18]。
(2)pf指数
h指数不能很好的展示当高值和长尾存在时的论文数量和质量[19]。单独增加论文的数量不会对h指数产生影响,“高峰”(即高被引论文)不会显著改变h指数,零被引文献的“长尾”也不会改变h指数。后来Egghe提出的g指数解决了h指数不对高被引论文敏感的问题[20]。但上述指标均不能反映长尾处的引文。为此,Prathap在2009年提出了p指数,其计算公式为:
p=(C2/P)1/3 = (C·C/P)1/3
即总被引次数与篇均被引次数之积的立方根,其中C是指某学者发表论文的总被引次数,P是指论文数。
2011年,Prathap G考虑多作者合作的问题提出了“分数式”计量的p指数(fractional p-indices)[21],即pf指数,其计算公式为:
pf = (Cf 2/Pf)1/3 = (Cf.Cf/Pf)1/3
其中,Cf = Σrici,Pf =Σri,ai是第i篇论文的作者合作度,ri表示赋予作者的荣誉的份额(分数)ri=1/ai。
3.2 考虑主要贡献作者
持有该观点的学者认为,在计算h指数时,只纳入该作者作为主要贡献作者的论文,代表人物为Hu XJ与Hirsh JE。Hu XJ等人提出了基于作者角色的h指数以及只考虑作为主要贡献作者论文的hmaj指数;Hirsh JE则从另外一个角度提出了只考虑该作者作为主要贡献作者论文的`h指数。
3.2.1 基于作者角色的h指数
在目前基金资助的科学研究中,首席科学家(principal investigators, PI)在一个独立的研究团队中起着主导作用。他们负责整个研究团队的方向,设计研究路线,分配科研任务,指导进行实验,并审核所产出的学术论文的逻辑性。因此,他们通常是整个研究团队中最重要的角色并通常担任多作者合作论文的通讯作者。然而他们通常并不直接参与一项具体的实验。每一个课题都被分配给一位负责人且在相关的论文中担任第一作者,其他对整个科研项目有较小贡献的参与者在论文中被署为合作者。有时在一个大的项目中,需要几位负责人在科研中都要起到核心作用,因此平行产生的一系列学术论文由这几位负责人轮流担任第一作者,有时轮流担任通讯作者。因此,通讯作者、第一作者和合作者在研究中所起的作用截然不同[22]。但是,这一现象还没有在作者合作视角下的h指数的讨论与研究中受到学者的关注。
目前,在生物医学领域的论文中,经常可以看到关于“前两个(或三个甚至多个)作者对于本论文有同样的贡献”,导致了“同为第一作者”的现象。当几个大的科研项目集体攻关某一科学问题时,产出的论文也可能有多个通讯作者。为此,Xiaojun Hu、Ronald Rousseau和Jin Chen认为h指数应有4种类型,即:
①考虑某作者所有论文的广泛意义上的h指数;
②作为第一作者h指数;
③作为通讯作者h指数;
④仅作为参与者h指数。
这4种h指数称为基于角色的h指数(role-based h-indices)。这种思想在第一作者数或通讯作者数日益增多的生物医学领域比较适用。但是在很多情况下,第一作者往往也作为通讯作者,将两者合称为主要贡献作者,提出了hmaj指数,该指数在计算时只考虑作为通讯作者和第一作者的论文[22]。
3.2.2`h指数
Hirsh JE在提出h指数时就指出其缺陷之一就是没有考虑到多作者合作,但同时指出新设计的指标又不能挫伤作者合作的积极性。为此,他在2010年又提出了`h指数(h-bar-index)。其计算方法为:将某作者的论文按被引次数从大到小排列,然后将每篇论文的合作者的h指数与该论文的被引次数作比较,若至少有一个作者的h指数大于该论文的被引次数,则认为该论文的被引次数是由该作者的合作者所贡献的,删除该论文,并将后面的论文序号依次提升。依次进行,直到某篇论文的序号大于被引次数,且符合`h的要求为止。`h指数是由合著者h指数及论文被引次数两个值所决定的,即`h 指数是动态的[23]。与hmaj指数类似,该指数只考虑那些除作者本人外,所有合作者的h指数均小于该论文被引次数的论文。
3.3 计算合作者权重
以上方法或指标都是对所有的合作者平均分配荣誉或者只考虑主要贡献作者的方法,在一定程度上影响了作者合作的积极性。为此又有学者提出了根据作者的排序(rank)计算合作者权重的观点。其中,Sekercioglu在Science上撰文提出基于作者排序的第k个作者是第一作者贡献率的1/k的计量方法[24]。Hagen在2008年提出了一种基于作者排序和合作作者数目的荣誉分配方法,以减少将荣誉归于全部作者以及平分到每个作者带来的一种通胀式或平均式的偏倚(inflationary bias or an equalising bias)[25]。他提出,在一篇合作度为N的论文中,第i个作者的荣誉ith author credit=(1/i)/(1 +(1/2) +…+(1/N))。此外还有ph指数和w指数。
3.3.1 ph指数
Prathap G在提出“分数式”计量的p指数时,也提出了“调和式”计量的p指数(harmonic p-indices)[26],即ph指数,其计算公式为:
Ph = (Ch2/Ph)1/3 = (Ch·Ch/Ph)1/3
其中,Ch= Σrici,Ph =Σri,ai是第i篇论文的作者合作度,ri表示赋予作者的荣誉的分数ri=1/ai。第j个作者的荣誉为:
ri =(1/j)/(1 +(1/2) +…+(1/ai)),其中Ch =Σrici,Ph =Σri
3.3.2 hp指数
Wan JK、Hua PH和Rousseau R于2007年提出了纯h指数(pure h-index,hp指数)的概念,用以评估既定作者的纯粹的贡献[27]。其具体计算方法为:
其中E(A)表示A作者纳入h指数的论文的篇均等效合作度,其计算公式为:
NE(A,D)表示作者A所在的论文D的等效合作度(the equivalent number of co-authors of author A in document D)。A为作者,D为论文,R为作者A在论文D的作者列表中的排名位次,N为论文D的作者总数(即合作度)。等效合作度的计算分几种情况:
①“分数式”计量,该方法将所有作者的荣誉平均分配,即等效合作度等于实际的合作度;
②“比例式“计量(proportional counting):NE(A,D) =(N(N+1))/(2(N+1-R));
③“几何式“计量(geometric counting):NE(A,D) =(2N-1)/(2N-R)。
该指标也可扩展到作者发表的所有论文(而不仅仅是那些被纳入h指数的论文),即修正的纯h指数[28]。
3.3.3 w指数
CT Zhang(张春霆)院士提出了一种计算合作者权重系数的方法以及一个新的指数,w指数(weighted h-index,加权h指数)。一名作者的带权引用次数为论文的引用次数乘以作者权重系数。他提出两项原则来计算作者权重系数。①荣誉三分原则:将一篇论文所获得的荣誉等分为3份。作为项目负责人的通讯作者和主要完成人的第一作者的权重系数均为l,其他作者的权重系数的总和为l。②线性原则:除通讯作者和第一作者外,其余作者所分得的荣誉按其作者排列顺序以等差级数递减。对一篇论文,第一作者和通讯作者的权重引用次数与论文引用次数相同。其他作者的权重引用次数随排名位置递减[29,30]。为了给权重系数的计算提供方便,笔者建立了一个网站,免费提供权重系数和权重引用次数的在线计算,详见:http://www.wcitation.org/。
表1 作者合作视角下h指数的主要计量方法
主要 观点 |
指标名称 |
代表人物及其提出年份 |
计量方法 |
优势与 不足 |
均分作者荣誉 |
hI指数 |
Batista,2006 |
作者的传统h指数值除以该作者纳入h指数的论文的平均作者合作度 |
计算方便,但未考虑作者不同的贡献度 |
ha指数(adapted pure h-index) |
Chai et al. 2008 |
论文的被引次数除以论文作者数的平方根 | ||
hm指数 |
Schreiber,2008,2010; Egghe,2008; |
每篇论文作者合作度的倒数乘以论文数或被引次数,对论文数或被引次数进行“分数式计量”,适用于各篇论文被引次数差异较小的作者 | ||
pf指数 |
Prathap G,2011 |
pf = (Cf 2/Pf)1/3 = (Cf·Cf/Pf)1/3 Cf = Σrici,Pf =Σri,ai是第i篇论文的作者合作度,ri表示赋予作者的荣誉份额分数ri=1/ai | ||
考虑主要贡献作者 |
基于角色的h指数(Role- based h-index) |
Hu XJ、Rousseau R、Chen J,2010 |
h指数有4种类型,即考虑某作者所有论文的广泛意义上的h指数;作为第一作者h指数;作为通讯作者h指数;仅作为参与者的h指数 |
计算方便,但在一定程度上影响了作者合作的积极性 |
hmaj指数 |
|
只纳入作为第一作者和通讯作者的论文 | ||
`h指数(h-bar-index) |
Hirsh,2010 |
由合作者h指数及论文被引次数两个值决定,只考虑那些除作者本人外,所有合作者的h指数均小于该论文被引次数的论文。该指数适用于那些学术上比较资深的合作者。 |
思路独特而巧妙,但计算比较复杂,需计算所有合作者的h指数 | |
计算合作者权重 |
— |
Hagen,2008 |
在一篇合作度为N的论文中,第i个作者的荣誉为ith author credit=(1/i)/(1+(1/2) +…+(1/N)) |
只根据作者的排序进行权重赋值,但未考虑到通讯作者的贡献度 |
ph指数
|
Prathap G, 2011 |
ph = (Ch2/Ph)1/3 = (Ch.Ch/Ph)1/3,其中, Ch= Σrici,Ph =Σri,ai是第i篇论文的作者合作度,ri表示赋予作者的荣誉份额分数ri=1/ai。 ai为作者合作度,第j个作者的荣誉为:ri =(1/j)/(1 +(1/2) +…+(1/ai)),其中Ch =Σrici ,Ph =Σri。 | ||
— |
Sekercioglu, 2008 |
基于作者排序(rank)的第k个作者是第一作者贡献率的1/k的计量方法 | ||
纯h指数 |
Wan JK、Hua PH、Rousseau R,2007 |
某作者传统h指数值除以该作者纳入h指数的论文的“篇均等效合作度”的平方根。 |
“篇均等效合作度”计算分几种情况,未明确具体方法 | |
w指数 |
CT Zhang, 2009 |
w指数(weighted h-index,加权h指数):一名作者的带权引用次数为论文的引用次数乘以作者权重系数。 |
考虑较全面,作者建立了网站,计算较方便 | |
Positionally Weighted h-indices, |
A. M. Abbas, 2011 |
基于作者排序(Position)的h指数,wj=2(k-j+1)/(k(k+1)),k为文章著者数,j为某著者的位次,1=<j<=k,0=<wj<=1 |
未考虑通讯作者的贡献 |
注:— 表示未明确提出新的指标,只是一种计量方法。
4 结语
合作关系是作者学术关系的重要内容,作者合作研究成果的学术荣誉分配问题历来是学术界关注的话题。h指数、g指数等评价指标的出现又为这一传统话题的讨论增加了新的内容。科学的进步促进了合作,合作的出现又使得记录科技成果的主要载体——科技文献中合著现象大量涌现。在合作论文日益增多和论文作者合作度不断升高的“大科学”时代背景下,如何合理地确定每个合作者的贡献程度,如何选择更为科学合理的计量方法,是摆在所有从事科学评价和科研管理人员面前的一个现实而紧迫的课题。从国际上针对h指数的诸多缺陷而开展的相关研究的趋势来看,改进作者被引次数的计量方法,合理评估合作者的贡献度是科学评价其学术影响力的关键因素与重要内容。对于合作者贡献的定量化研究能够激励合作者在论文中澄清每位作者的贡献比例,有助于建立合作的意义与作者排序的良性关联,有助于在科研评价中科学、合理地评估合作者的贡献度。
本研究将作者合作关系作为科研人员学术影响力评价中应考虑的重要因素,针对目前未考虑多作者合作而出现的作者“引用次数泡沫”的现象,在理论方面对现有的不同学者对作者合作视角下的被引次数、h指数、g指数等指标开展的修正研究的主要思想和具体的计量方法进行了归纳与比较分析:“均分作者荣誉”、“考虑主要贡献作者”和“计算和作者权重”3种观点各有优势与不足。具体处理方法的应用可能还要结合不同的合作度与合作模式。本研究的下一步将对我们医学领域不同学科SCI论文作者合作度的分布规律以及不同的合作模式对论文被引次数的影响进行分析,以期揭示这3种观点在评价国内学者的国际影响力时的具体适用条件。并通过实证研究选择更为科学合理的评估合作者贡献度的计量方法,以对科研人员的学术表现进行更加客观、公正的评价。
参考文献
[1] Wuchty S, Jones BF, Uzzi B. The increasing dominance of teams in production of knowledge[J]. Science,2007, 316(5827): 1036–1039.
[2] Greene M. The demise of the lone author[J]. NATURE,2007,450(7173): 1165-1165
[3] J.E Hirsch.An index to quantify an individual’s scientific research output that takes into account the effect of multiple coauthorship[J].Scientometrics,2010,85(3):741-754.
[4] 周春雷.h指数合作式注水缺陷与对策[J].图书情报知识,2009(5):109-112
[5] 谢彩霞. 国际科学合作研究状况综述[J].科研管理,2008,29(3):179-186.
[6] M. Smith.The trend toward multiple authorship in psychology[J]. The American Psychologist, 1958,13(10):596–599.
[7] D.J. de Solla Price. Little Science, Big Science[M]. Columbia University Press, New York, 1963.
[8] 蒋颖,金碧辉,刘筱敏.期刊论文的作者合作度与合作作者的自引分析[J].图书情报工作,2000, 43(12):23-28.
[9] B. Cronin. Hyperauthorship: a postmodern perversion or evidence of a structural shift in scholarly communication practices[J]. Journal of the American Society for Information Science and Technology,2001, 52(4):558–569.
[10] H. Kretschmer,R. Rousseau. Author inflation leads to a breakdown of Lotka’s law[J].Journal of the American Society for Information Science and Technology,2001,52(5):610–614.
[11] J.P. Birnholtz, What does it mean to be an author? The intersection of credit, contribution, and collaboration in science[J].Journal of the American Society for Information Science and Technology 2006,57(13):1758–1770.
[12] Claxton LD. Scientific authorship. Part 2. History, recurring issues, practices, and guidelines[J] Mutat Res. 2005 ,589(1):31-45.
[13] Hirsch JE. An index to quantify an individual’s scientific research output[J]. Proc Natl Acad Sci,2005, 102(46): 16569-72.
[14] Batista PD, Campiteli MG, Kinouchi O,et al. Is it possible to compare researchers with Different scientific interests? [J].Scientometrics,2006,68(1):179–189.
[15] Schreiber M. A modification of the h-index: the hm-index accounts for multi-authored manuscripts[J].Journal of Informetrics,2008,2(3):211–216.
[16] Schreiber M. To share the fame in a fair way, hm modifies h for multi-authored manuscripts[J]. New Journal of Physics,2008,10(4):211–216.
[17] Schreiber M. A case study of the modified Hirsch index hm accounting for multiple coauthors[J].Journal of the American Society for Information Science and Technology, 2009,60(6):1274–1282.
[18] Egghe L. Mathematical theory of the h-index and g-index in case of fractional counting of authorship[J].Journal of the American Society for Information Science and Technology, 2008,59(12):1608–1616.
[19] Prathap, G. Is there a place for a mock h-index[J]. Scientometrics,2009,84(1): 153-165
[20] Egghe L. Theory and practise of the g-index[J]. Scientometrics,2006,69(1):131-152.
[21] Prathap G. The fractional and harmonic p-indices for multiple authorship[J]. Scientometrics,2011,86(2):239-244
[22] Xiaojun Hu,Ronald Rousseau,Jin Chen.In those fields where multiple authorship is the rule,the h-index should be supplemented by role-based h-indices[J].Journal of Information Science,2010,36(1):73-85.
[23] J.E Hirsch.An index to quantify an individual’s scientific research output that takes into account the effect of multiple coauthorship.Scientometrics,2010,85(3):741-754.
[24] Sekercioglu CH. Quantifying coauthor contributions[J]. Science,2008,322(5900):371.
[25] N.T. Hagen. Harmonic allocation of authorship credit: source-level correction of bibliometric bias assures accurate publication and citation analysis[J]. PLoS ONE,2008,3(12):e4021.
[26] Prathap G. The fractional and harmonic p-indices for multiple authorship[J]. Scientometrics, 2011,86(2):239-244
[27] Wan JK, Hua PH, Rousseau R.The pure h-index: calculating an author’s h-index by taking co-authors into account[J].COLLNET Journal of Scientometrics and Information Management, 2007,1(2):1–5.
[28] J.C.Chai, P.H.Hua, R.Rousseau and J.K.Wan, The adapted pure h-index.In: H.Kretschmer and F.Havemann(eds), Proceedings of WIS 2008, Berlin. Fourth International Conference onWebometrics, Informetrics and Scientometrics and Ninth COLLNET Meeting. Open access. Available at: www. collnet. de/ Berlin-2008/ Chai WIS2008aph.pdf (accessed 25 March 2011).
[29] Zhang C T. A proposal for calculating weighted citations based on author rank[J].EMBO Reports, 2009,10(5):416–417.
[30] 张春霆. 如何评价一名科研人员的学术表现?——关于论文引用次数泡沫问题及解决方案[J].科技导报,2009,27(10):1.
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 10:26
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社