随想图情分享 http://blog.sciencenet.cn/u/周春雷 博以知不足,在灌水中聆听生命的嬉戏

博文

关于h指数的一点感想

已有 10933 次阅读 2009-6-4 13:16 |个人分类:h指数|系统分类:观点评述| h指数

   本想摘录杰出科教人才引进评估高层战略研讨会文字实录 http://www.sciencenet.cn/htmlnews/2009/6/219856.shtm 中h指数相关部分与大家探讨,中午之前还能看到,现在打开却是略了,很奇怪。算了,那就简单谈点读后感吧。

    从会议发言看,h指数现在真是相当深入人心了,似乎就连一些资深科学家也以提出一些修正指标为荣呢。如果管理部门也对h指数的威力持类似的乐观看法,那可就值得忧虑了。上有所好,下必甚焉。作为简单的数字指标,h指数以及多种变体都是相当脆弱的。如果h指数成功地营造了新的数字迷信,甚至能左右资源配置,那种种可钻的漏洞绝对会被人利用得令人瞠目结舌。

    为回应Bobby兄提出的问题,特增加以下部分供大家批评指正!开博已有三月,已经度过初期的过度敏感了,所以大家尽可放开评论!:)

----------------

    如朋友们有兴趣,可玩味我以前指出的两个问题,它们应该有助于大家理解这新的数字游戏,:)

h指数合作式注水缺陷与对策

h指数的潜在缺陷——h指数精确注水问题研究

我对h指数的看法可以整理为:---h指数评价中的公平问题

为节约读者时间,我把原文粘了过来:
    我提出的问题从数学角度看其实很简单,那就是h指数其实很脆弱,很容易被操纵。通过向h核左部空降大数(挂名)、h核右部拦河建坝(选择一个位置,从该值开始累加引用,左侧相应增加数字,直到该处可以成为新h核的右侧边界),即可使h指数合法地快速增长。

假设我们用降序序列da来表示从某个引文数据库检索得到的某一作者名下的文章被引次数列表,即da{c1,c2,…,c(h+1), …,ct},其中c1≥c2≥…≥ct≥0。根据h指数定义,从左向右核对,如果某篇论文的序号(h+1)大于论文被引次数c(h+1),则该序号减去1就是h指数,大于c(h+1)的引文数被定义为h core。从数学角度看,h指数的计算思想其实很简单,其影响因素仅是降序序列da的长度以及其中元素值的大小。显然,如果h core中插入了一些数值,将引起h core长度的增长,这很可能导致h指数的增长。我们看一个具体例子,da{10,9,8,7,6,5…},数字5左边的都属于h核。如果h核中引入了一些大于5的数字,h指数将增长。将同名作者成果、合作论文全都归于某一作者名下等情况均可能导致h核的增长。如果想提升h指数,最快捷的办法莫过于向h核中插入数字,按照h指数的原始定义,互相挂名即可达到这种目的。诚然,能玩这种行为艺术的需要有相当的积累,一个牛人不能从与学界新人的合作中得到这种好处。从理论上说,若有20个人,每人都能发表被引次数不少于20次的文章,他们联合署名,则每人仅需写出一篇文章即可保证大家的h指数都达到20,进入国际大牛行列。设想两个学术水平相当的人,一个喜欢形式“合作”,一个不喜欢形式“合作”,采用h指数评价会得到两个人水平相去甚远的结论,这合适吗?与h指数其它形式的‘rest on their laurels’的弊端相比,还有危害更大的缺陷吗?这个问题不仅影响h指数,绝大多数衍生h指数同样受影响,如g指数、A指数、AR指数等。

    诚然,这是纯粹的数字游戏,沙盘推演。我不想成为活靶,:)我提出的精确注水和合作式注水问题没有任何现实针对性,纯粹是基于数列的推演和思考。

    我指出的h指数评价中的公平问题(对独著者的隐性歧视问题)和合作效应(h指数的增长空间从理论上来说仅取决于合作圈子大小),这些东西到底有没有价值,敬请大家各抒己见!
 



https://blog.sciencenet.cn/blog-60286-236068.html

上一篇:科学网可否将最新评论单列为一个板块?
下一篇:科学史是信史么?
收藏 IP: .*| 热度|

19 赵星 杨学祥 刘玉平 毛飞跃 任胜利 刘进平 陈绥阳 孙学军 朱志敏 曹聪 吴飞鹏 杨秀海 陈国文 马丽丹 王启云 柳东阳 蔣勁松 郭磊 贺天伟

发表评论 评论 (15 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-23 11:57

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部