|
引用率的异化:从手段到目的之蜕变
李侠
(上海交通大学 科学史与科学文化研究院)
近期《科学》杂志发表一篇名为《中国的科学家经常引用本国的研究成果,这是否扭曲了全球研究排名?》,文章用两个数据来源:其一,日本国家科学技术政策研究所(NISTEP)发布了一项研究显示,中国在2020至2022年间被引用次数最多的前10%论文中,有62%的引用来自国内学者,这一比例远高于其他国家;其二,德国慕尼黑的路德维希·马克西米利安大学的克劳迪亚•斯坦因文德(Claudia Steinwender)及其两位同事,筛选出20个科学领域内排名前10%的461种期刊在2000至2021年间发表的所有论文,研究显示中国论文获得的引用中,有57%来自国内学者,这一比例在所有研究国家中最高,而美国则以37%的本土引用率位居第二。对于造成这种情况的原因他们给出的解释是“本土偏好/偏见”,在纠正了这一本土偏见后,中国在2000年至2021年顶级期刊总引用量排名中从第二位降至第四位,落后于美国、英国和德国。由此他们得出结论:中国在引文排名中的显著上升被夸大了。
客观地说,这些研究者对中国科研的发展现状比较敏锐,引用率的大幅提升恰恰是中国科技快速发展的直接表征,引用率浮肿是一个世界性现象,他们给出的解释有合理的地方,但仅停留在现象的表面,由于对中国科技运行模式的陌生,他们对与中国科技体制机制有关的深层原因并未涉及到。在笔者看来造成中国科技论文引用率大幅提升的解释有待进一步深挖,笔者曾在2021年写过一篇博客文章《下载量和引用量哪个指标更合适?》,当时也曾思考过引用率这个指标由于其在学术承认与评价方面的独特功能,再加上人们对其日渐熟悉,这个指标是否已经被中国学术界玩坏了?是否应该换一种思路来评价科研人员的表现。如今看来,这个问题已经引起国际学术界的高度关注。
众所周知,引用率指标的引入原本是管理者为了评价科研人员的工作质量而精心选择的一种评价指标,而且最初的设定是科研人员在理想的环境下能够被客观评价,而不会动歪脑筋与钻空子。再者,这个评价体系还预设高引用率代表高质量,从节省时间成本角度来看,通过引用率可以在众多文献中快速找出高质量的文章,这种优点既符合经济原则,又满足了客观评价的要求,因此,引用率指标在科学界快速被管理部门与科学共同体共同接受。再加上管理部门出于绩效主义的考虑对此推波助澜,引用率在当下的学术界已成为获得承认的重要标的物,这个评价模式几乎适用于科技界的所有领域和环节,小到评价个人水平(高被引学者)、中到评价一本刊物(刊物的影响因子)、大到评价整个国家或区域(国家/区域的引用率全球排名)的科技发展水平,引用率衍生出的这些神奇功能是始作俑者完全没有预料到的,这种转变迅速让引用率指标的初始功能从评价手段向评价目的之蜕变,一切都是为了引用率,这种现象被称作引用率的异化。引用率异化会带来哪些潜在的危害呢?
根据过往经验可以发现引用率的异化通常会造成如下三种危害,首先,导致科技评价模式出现严重的路径依赖,并最终演变为路径锁定,一旦形成评价习惯固化很难改变。由于引用率指标的简单与客观,在人情关系根深蒂固的社会环境中,科技管理部门很喜欢这种评价手段,由于管理部门的认可与加持,这种评价模式迅速完成从点到面的扩散,并逐渐被科技界广泛接受,久而久之,人们内心中把这种评价模式视作理所当然,一旦认知习惯形成,人们就不愿再打破这种习惯或模式,这就进入了路径依赖阶段,随着对这种评价习惯的认知固化,人们就很难再逃出它的掌控,即便知道这种评价手段存在缺陷也无能为力,这就进入了路径锁定阶段,再想推倒重来简直是不可能的。既然改变不了,那么人们就开始利用这套评价标准自身存在的漏洞,制造出很多令人匪夷所思的引用乱象,诚如樊秀娣教授指出的“巴结引”、“被迫引”、“相互引”、“谄媚引”等。
其次,科技评价体制具有再生产功能。试想SCI在中国科技评价体系中的引入不到四十年时间,其弊端早已充分显现,然而要取消这套评价体系却异常艰难,管理部门甚至不惜抛出“去四唯/去五唯”的严厉手段,然而,时至今日,效果并不明显。要知道当年采取SCI评价标准并不是国家强制推行的结果,而是各个科研部门主动加入的结果,由于其简单客观的优势,这个评价标准迅速扩散,这就是科技评价体制内在所具有的再生产功能的最好体现。回到引用率问题,也面临着同样的困境,尤其是当管理部门在各个环节把引用率做为评价人才水平的重要指标时,引用率的再生产机制就被无形中启动了,而且根本停不下来,当每年都推出“高被引学者”排名、高被引文章排名、个人代表作的引用率、基于引用率的H指数排名、国家的引用率排名等仍然被追捧时,引用率的异化无非是再生产机制的副产品而已。
第三,过分追求引用率会造成科技界的泰罗制以及绩效主义的泛滥。当引用率会带来更大的承认与经济回报时,科技共同体会被这根指挥棒所驱使,这会误导科技的发展方向,避实就虚,为论文而论文,真正事关国计民生的卡脖子问题反倒无人问津,这不仅会造成虚假的学术繁荣,还会加剧科技界的无效内卷。笔者一直想知道,每年中国产出的那些“高被引论文”还有那些“高被引学者”,到底解决了什么实际问题?为人类贡献了多少原创性知识?
回到本文开篇话题,除了有限的本土偏见/偏好这一原因之外,到底是什么力量导致中国论文引用率大幅提升的呢?在笔者看来,深层原因有三。其一,最根本原因就是中国科技体量庞大,科技论文产出数量巨大,在时间累积效应的加持下,由此带来引用率的快速提高本是题中应有之义;其二,中国学术界的跟风研究传统带来引用的短期井喷现象,导致每一次热点问题一经出现就会引来大量中国学者的快速跟进,热潮过后,等待下一波热点,而每一次热点跟风研究都会带来巨大的引用数量,这自然会带来间歇性的引用井喷现象;第三,有些议题是中国独特的、或者占优势的研究领域,此类文献成果大多由中国科研人员产出,因此,引用的文献库存也大多是中国学者做出来的,这类研究的引用自然也就以本土学者的文献为主,反之亦然,如果某一领域国内学者很少涉及,文献数量库存自然会少很多,想引用本土资源也无法实现。从这个意义上说,中国论文发文量与总引用率提高是一种相互促进的现象,回到文献的平均引用率,我们也仅仅是刚刚过世界平均水平,远没有达到们的预期。需要警惕的是,对于引用率指标的使用不能使之成为新的科技评价神器,它永远是手段而不是目的。无数实践证明,管理范式与人类认知习性都是有惯性的,从路径依赖滑落到路径锁定往往比我们想象的来得快,四唯/五唯的神话就是很好的例证,否则下一次我们就要为去“引用率”而苦恼了。那么该如何从制度设计层面最大限度上遏制这种路径依赖偏好呢?
笔者认为,从理念上我们要努力克服科技的线性评价观拥抱复杂的多元化评价观,多个成功评价指标的分布式并行运用将极大稀释单一指标带来的指标功能异化现象,从而更全面科学地评价科技成果以及科技人才,而且多元化的评价指标不但能起到功能分流的作用,也能更好地符合不同学科的差异性,这样就避免了一把尺子量天下的弊端,也就不会大范围出现医生放下手术刀一门心思去卷论文的怪现象了,再比如评价马斯克,我们不需要看他的论文有多少引用率,只要看看他取得实际科技成就就可以了。从线性评价到多元化评价的转变恰恰是科研生态良好的标志。今天中国的科技界需要开始关注那些长期被单一评价指标扭曲与异化的领域,只有这样我们才能在另一个科技赛道(实践领域)取得重大突破,就如同我们的科技论文在短短的二十年间实现质的突破:从少到多,从弱到强,以至于我们今天的发文总量与引用率都已经位居世界前列。如果评价标准多元化,那么,那些被遮蔽的科技赛道同样会茁壮成长起来,并取得令世界瞩目的成就。
【博主跋】这篇小文章是前几天应《中国新闻周刊》杜老师之邀而写,首发在《周刊》2024-10-31日的公众号上,纸质版为2024-11-4总第1162期《中国新闻周刊》杂志,发表时文章名略有改动,这是原稿,与杜老师合作愉快,是为记!
说明:文中图片来自网络,没有任何商业目的,仅供欣赏,特此致谢。
2024-11-1于南方雨天临屏涂鸦
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-1 17:20
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社