|
注:图片来源于推特@Scopus对于一项研究《The Citation Trap: Papers Published at Year-End Receive Systematically Fewer Citations》的报道。
马超/ 东南大学
学者们都很关注自己论文的被引次数,毕竟它可能事关荣誉、薪水、头衔、项目。但你可能从来没有想过,同样水平的论文,如果不巧发在年底,被引次数会打个8折哦。
文献检索系统导致的 Citation Trap
为什么会这样呢?我们举个例子,今天是2020.3.31,假设你想搜某个话题近5年的研究,多数情况下你会以2016.1.1作为起点,而不是从2016.3.31开始。这种搜索习惯,会让年底文章被暴露在搜索中的时间少于年初的文章。年末和年初发表的论文在检索中会有多大差别?假设A文章发表于2015.12,B文章发表于2016.1,A文章会在2015.12月、2016全年、2017全年、2018全年、2019全年这49个月处在检索时间范围内,到了2020年,人们搜索近5年的文章就不会再搜索2015年的研究,因此A不在检索范围内。而B文章,会在2016.1-2020.12这60个月中全处在检索时间范围内。所以,B比A晚发表一个月,却能比A多被人检索11个月,因此也会有更大概率被引用。这样由于搜索而造成年末论文被引更少的现象,我们定义它为Citation Trap!
其实,学术搜索引擎也在一直误导大家去制造Citation Trap。不信你去登一下Google Scholar,页面左侧是“Since 2016”、“ Since 2019”,而不是“recent 4 years”、“recent 1 year”。其他学术搜索引擎,如WoS、Jstor也都类似。你按照他们的界面点击鼠标,就已经在制造Citation Trap。
年末发表文章的被引次数要少约20%
我们收集了1956年-2010年期间Web of Science上的经济学论文,剔除掉关键变量缺失的样本,以及AERpp这种特殊月份的特刊,共有样本208,977篇。我们进行了回归分析:因变量是log(被引次数+0.0001),核心变量是Year-end(1=年末,10-12月;0=其他月份),再加了一系列控制变量(比如标题长短、论文页数、作者人数、参考文献数量、作者首字母排序、是否是卷首论文等),以及年份固定效应和期刊固定效应之后,结论显示,相比于非年末,年末发表文章的被引次数要少约20%。
随后,我们做了一系列稳健性检验,以保证主结果的可信。我们分别去除了0值、去除了最高引5%的;将OLS改为Nb-reg、Inv-sine;将年末的定义从10-12月改为12月、11-12月、9-12月、8-12月、7-12月;将核心变量由是否年末的0-1变量,改成以1月为基准,11个月份的虚拟变量去回归。均发现越是年末的月份,引用显著越少。
到这里,可能还不是让你信服。因为年末的文章比年初的文章后发表,后发表当然被引的少,被引少到底是Citation Trap还是仅仅因为出现的晚?我们随后通过构造新的“年”来打消这一疑虑:正常的“年”是从1月到12月,我们构造的年“Oct-Year”,是指用前一年的10月作为一年的起始,用当年的9月作为一年的末尾。这样的好处是,在进行上述回归时,是用当年的1-9月vs.前一年的10-12月,也就是说年末的文章其实比年初的文章早发表了好几个月,如果还发现负的显著,那就说明年末被引次数少不是因为出现的晚这一原因。同理,还可以构造“Dec-Year”、“Nov-Year”等。这种设定也可以认为是citation trap的下界,下界大概是10%。
随后我们又通过数据验证了,并不存在老练的学者(团队)有意识把论文发在年初的现象;期刊编辑也没有对年初年末有不同的安排;论文出现在搜索引擎的位置也不会影响本文结论。一切都指向一个证据——论文发在年末,引用次数就少。
是Citation Trap 导致的结果吗?
到此为止,读者应该对“年末论文引用次数少于年初论文”这一结论买账,但还无法说明,这一结论是由于检索导致的Citation Trap,还是其他不可观测因素导致。我们用了两个suggestive evidence来验证:
(1)如果是检索导致的Citation Trap,那么这种效应应该随着时间推移越来越明显。因为越是当代,越依赖于“网络检索”。
(2)如果是检索导致的Citation Trap,那么Top期刊这种效应小,非Top期刊这种效应大。因为Top期刊有一群忠实读者,他们会盯着每一期看,而非Top期刊上的论文被人读到,更依赖于“检索”。
我们验证了上述2点,从而给出了一个完整的Citation Trap的故事。
基于“机会平等理论”的解释
至于这篇经济学研究的政策含义呢,其实经济哲学里有个著名的机会平等理论,大意是个体所珍视的“优势”(比如收入、地位、健康等),由两方面因素决定:自己无力控制的称为“环境”,自己可控的称为“努力”。如果“优势”上的不平等是由“努力”因素造成的,这在道德上很合理;如果是由“环境”因素带来的,那么就是机会的不平等。在现实生活中,“环境”究竟对一个人的“优势”起到多大作用,是不同派系学者们争论的焦点。例如,精英主义者通常认为自己所获得的一切全靠“努力”得来;而罗尔斯主义者则倾向于强调“环境”的作用,因此需要通过社会政策的调节来给大家提供平等的机会。
这项研究实际上考察了经济学家们所珍视的“优势”(论文被引次数),是如何被某一细小“环境”(论文被排在了年初还是年末)所左右的。纵然经济学家们可以非常“努力”地写出高质量的论文并发表,但你看,一个小小的“环境”居然就左右了20%的“优势”,精英主义者们又怎能拍着胸脯心安理得地说,我所有的成功都moral deserve?
Ma, C., Li, Y., Guo, F., & Si, K. (2019). The citation trap: Papers published at year-end receive systematically fewer citations. Journal of Economic Behavior & Organization, 166, 667-687.
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-19 19:37
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社