武夷山分享 http://blog.sciencenet.cn/u/Wuyishan 中国科学技术发展战略研究院研究员;南京大学信息管理系博导

博文

一个有趣的文献计量学指标 精选

已有 7987 次阅读 2013-12-15 06:54 |个人分类:科学计量学研究|系统分类:观点评述

一个有趣的文献计量学指标

武夷山  

 

JASIST杂志2013年第9期发表以色列学者Lior Rokack和美国学者Prasenjit Mitra合写的论文,Parsimonious Citer-BasedMeasures: The Artificial Intelligence Domain as a Case Study(基于简约引用者的测度指标:以人工智能领域为例)。

作者的主要意思是:只看被引次数,不一定能反映被引用文献的真正价值。博主来举个假想例子。一篇论文被6篇文章各引用1次,共6次,6篇文章都是单作者,分别是ABCDEF ;另一篇文章被15篇文章各引用1次,共15次,但这些文章的作者其实都是3个人(abc),16篇文章的署名情况分别是:abc, bac, acb, bca, cab,cba, ab, ba, ac, ca, bc, cb, a, b, c。也就是说,前一篇文章受到6人认可,后一文章虽然被引次数高,但是只受到3人认可。哪篇文章更有价值呢?

本文两位作者定义了“简约引用者人数”(parsimonious number ofciters,以下简记为PNC),定义方式请见原文。它是读过某篇论文的所有引用者人数的下限。可以通过解一个线性规划方程来求出PNC。这个线性规划问题对应于经典的set covering problemSCP,集合覆盖问题)。两位作者决定采用贪婪算法来求解这个线性规划问题。

然后,他们用人工智能领域的100位科学家的文章来验证新指标表现如何。100位中,50位属于杰出科学家,他们是人工智能促进学会(AAAI)的会士(Fellows),从1995年至2011年,全世界只有106人获得会士称号(博主:我看了一眼会士名单,1995年以来入选的会士中,只有2013年入选的香港科技大学的Qiang Yang是华裔);另外50位不是AAAI的会士,而是高产作者,他们至少在Web of Science收录的108种人工智能期刊上发表了5篇文章,且最早发表的1篇文章发表于2001年前(以保证有10年的评估期)。这么一限制,则后面50位科学家属于人工智能领域头10%的作者。

将这100人的论文都找出来,分别统计或计算每篇文章的引用次数、引用者人数和简约引用者人数(PNC)。若每篇文章都只有一个作者,则上述三个指标数值相等。

分析表明,PNC与另外两个指标显著相关,但它有两个优点:

1.      不同领域的署名习惯不一样,有的领域的文章动辄有好多作者,有的则严格限定作者的资格。采用PNC来评价论文,就不受领域差异的影响。

2.      NPC对于杰出科学家和非杰出科学家有较好的区分度。

该指标的缺点是,若作者人数、文章篇数很多,求解线性规划问题没有那么容易。




http://blog.sciencenet.cn/blog-1557-749880.html

上一篇:[转载]“雨人”原型----记忆天才匹克
下一篇:Use the Right Word摘抄(20)--如何“区分”

47 许培扬 陈湘明 王贤文 曹聪 尤明庆 刘全生 毛进 章成志 赵美娣 赵星 黄秀清 刘宇 强涛 刘淼 吕鹏辉 陈小润 袁海涛 庄世宇 王国强 徐晓 李毅伟 杨正瓴 徐英祺 黄雪寅 钟炳 俞立平 张良辉 徐传胜 陈小斌 周春雷 李伟钢 陈冬生 张铁峰 李健 肖振亚 魏瑞斌 赵静 李泳 唐常杰 赵凤光 曹建军 唐凌峰 李天成 王晓光 贡金涛 liangzx yunmu

该博文允许注册用户评论 请点击登录 评论 (18 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备14006957 )

GMT+8, 2019-4-23 12:12

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部