||
一个有趣的文献计量学指标
武夷山
JASIST杂志2013年第9期发表以色列学者Lior Rokack和美国学者Prasenjit Mitra合写的论文,Parsimonious Citer-BasedMeasures: The Artificial Intelligence Domain as a Case Study(基于简约引用者的测度指标:以人工智能领域为例)。
作者的主要意思是:只看被引次数,不一定能反映被引用文献的真正价值。博主来举个假想例子。一篇论文被6篇文章各引用1次,共6次,6篇文章都是单作者,分别是A、B、C、D、E、F ;另一篇文章被15篇文章各引用1次,共15次,但这些文章的作者其实都是3个人(a、b、c),16篇文章的署名情况分别是:abc, bac, acb, bca, cab,cba, ab, ba, ac, ca, bc, cb, a, b, c。也就是说,前一篇文章受到6人认可,后一文章虽然被引次数高,但是只受到3人认可。哪篇文章更有价值呢?
本文两位作者定义了“简约引用者人数”(parsimonious number ofciters,以下简记为PNC),定义方式请见原文。它是读过某篇论文的所有引用者人数的下限。可以通过解一个线性规划方程来求出PNC。这个线性规划问题对应于经典的set covering problem(SCP,集合覆盖问题)。两位作者决定采用贪婪算法来求解这个线性规划问题。
然后,他们用人工智能领域的100位科学家的文章来验证新指标表现如何。100位中,50位属于杰出科学家,他们是人工智能促进学会(AAAI)的会士(Fellows),从1995年至2011年,全世界只有106人获得会士称号(博主:我看了一眼会士名单,1995年以来入选的会士中,只有2013年入选的香港科技大学的Qiang Yang是华裔);另外50位不是AAAI的会士,而是高产作者,他们至少在Web of Science收录的108种人工智能期刊上发表了5篇文章,且最早发表的1篇文章发表于2001年前(以保证有10年的评估期)。这么一限制,则后面50位科学家属于人工智能领域头10%的作者。
将这100人的论文都找出来,分别统计或计算每篇文章的引用次数、引用者人数和简约引用者人数(PNC)。若每篇文章都只有一个作者,则上述三个指标数值相等。
分析表明,PNC与另外两个指标显著相关,但它有两个优点:
1. 不同领域的署名习惯不一样,有的领域的文章动辄有好多作者,有的则严格限定作者的资格。采用PNC来评价论文,就不受领域差异的影响。
2. NPC对于杰出科学家和非杰出科学家有较好的区分度。
该指标的缺点是,若作者人数、文章篇数很多,求解线性规划问题没有那么容易。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-20 10:32
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社