林墨分享 http://blog.sciencenet.cn/u/ZJUlijiang 分享以科学家为对象的研究论文

博文

年底比年初的论文的被引次数少20% 精选

已有 8615 次阅读 2020-4-1 14:28 |系统分类:科研笔记

说明:本博客与微信公众号“林墨”同步更新,所有内容均为原创,可授权转载请扫码关注“林墨”公众号。


注:图片来源于推特@Scopus对于一项研究The Citation Trap: Papers Published at Year-End Receive Systematically Fewer Citations》的报道。


马超/ 东南大学


学者们都很关注自己论文的被引次数,毕竟它可能事关荣誉、薪水、头衔、项目。但你可能从来没有想过,同样水平的论文,如果不巧发在年底,被引次数会打个8折哦。


文献检索系统导致的 Citation Trap


为什么会这样呢?我们举个例子,今天是2020.3.31,假设你想搜某个话题近5年的研究,多数情况下你会以2016.1.1作为起点,而不是从2016.3.31开始。这种搜索习惯,会让年底文章被暴露在搜索中的时间少于年初的文章。年末和年初发表的论文在检索中会有多大差别?假设A文章发表于2015.12,B文章发表于2016.1,A文章会在2015.12月、2016全年、2017全年、2018全年、2019全年这49个月处在检索时间范围内,到了2020年,人们搜索近5年的文章就不会再搜索2015年的研究,因此A不在检索范围内。而B文章,会在2016.1-2020.12这60个月中全处在检索时间范围内。所以,B比A晚发表一个月,却能比A多被人检索11个月,因此也会有更大概率被引用。这样由于搜索而造成年末论文被引更少的现象,我们定义它为Citation Trap

其实,学术搜索引擎也在一直误导大家去制造Citation Trap。不信你去登一下Google Scholar,页面左侧是“Since 2016”、“ Since 2019”,而不是“recent 4 years”、“recent 1 year”。其他学术搜索引擎,如WoS、Jstor也都类似。你按照他们的界面点击鼠标,就已经在制造Citation Trap。


年末发表文章的被引次数要少约20%


我们收集了1956年-2010年期间Web of Science上的经济学论文,剔除掉关键变量缺失的样本,以及AERpp这种特殊月份的特刊,共有样本208,977篇。我们进行了回归分析:因变量是log(被引次数+0.0001),核心变量是Year-end(1=年末,10-12月;0=其他月份),再加了一系列控制变量(比如标题长短、论文页数、作者人数、参考文献数量、作者首字母排序、是否是卷首论文等),以及年份固定效应和期刊固定效应之后,结论显示,相比于非年末,年末发表文章的被引次数要少约20%

随后,我们做了一系列稳健性检验,以保证主结果的可信。我们分别去除了0值、去除了最高引5%的;将OLS改为Nb-reg、Inv-sine;将年末的定义从10-12月改为12月、11-12月、9-12月、8-12月、7-12月;将核心变量由是否年末的0-1变量,改成以1月为基准,11个月份的虚拟变量去回归。均发现越是年末的月份,引用显著越少。

到这里,可能还不是让你信服。因为年末的文章比年初的文章后发表,后发表当然被引的少,被引少到底是Citation Trap还是仅仅因为出现的晚?我们随后通过构造新的“年”来打消这一疑虑:正常的“年”是从1月到12月,我们构造的年“Oct-Year”,是指用前一年的10月作为一年的起始,用当年的9月作为一年的末尾。这样的好处是,在进行上述回归时,是用当年的1-9月vs.前一年的10-12月,也就是说年末的文章其实比年初的文章早发表了好几个月,如果还发现负的显著,那就说明年末被引次数少不是因为出现的晚这一原因。同理,还可以构造“Dec-Year”、“Nov-Year”等。这种设定也可以认为是citation trap的下界,下界大概是10%。

随后我们又通过数据验证了,并不存在老练的学者(团队)有意识把论文发在年初的现象;期刊编辑也没有对年初年末有不同的安排;论文出现在搜索引擎的位置也不会影响本文结论。一切都指向一个证据——论文发在年末,引用次数就少。


是Citation Trap 导致的结果吗?


到此为止,读者应该对“年末论文引用次数少于年初论文”这一结论买账,但还无法说明,这一结论是由于检索导致的Citation Trap,还是其他不可观测因素导致。我们用了两个suggestive evidence来验证:

(1)如果是检索导致的Citation Trap,那么这种效应应该随着时间推移越来越明显。因为越是当代,越依赖于“网络检索”。

2)如果是检索导致的Citation Trap,那么Top期刊这种效应小,非Top期刊这种效应大。因为Top期刊有一群忠实读者,他们会盯着每一期看,而非Top期刊上的论文被人读到,更依赖于“检索”。

我们验证了上述2点,从而给出了一个完整的Citation Trap的故事。


基于“机会平等理论”的解释


至于这篇经济学研究的政策含义呢,其实经济哲学里有个著名的机会平等理论,大意是个体所珍视的“优势”(比如收入、地位、健康等),由两方面因素决定:自己无力控制的称为“环境”,自己可控的称为“努力”。如果“优势”上的不平等是由“努力”因素造成的,这在道德上很合理;如果是由“环境”因素带来的,那么就是机会的不平等。在现实生活中,“环境”究竟对一个人的“优势”起到多大作用,是不同派系学者们争论的焦点。例如,精英主义者通常认为自己所获得的一切全靠“努力”得来;而罗尔斯主义者则倾向于强调“环境”的作用,因此需要通过社会政策的调节来给大家提供平等的机会。

这项研究实际上考察了经济学家们所珍视的“优势”(论文被引次数),是如何被某一细小“环境”(论文被排在了年初还是年末)所左右的。纵然经济学家们可以非常“努力”地写出高质量的论文并发表,但你看,一个小小的“环境”居然就左右了20%的“优势”,精英主义者们又怎能拍着胸脯心安理得地说,我所有的成功都moral deserve?



fullsizeoutput_5b.jpeg


Ma, C., Li, Y., Guo, F., & Si, K. (2019). The citation trap: Papers published at year-end receive systematically fewer citations. Journal of Economic Behavior & Organization, 166, 667-687.









fullsizeoutput_58.jpeg

















https://blog.sciencenet.cn/blog-1792012-1226353.html

上一篇:来中国后,他们发表了更多的论文
下一篇:诺贝尔奖得主有哪些异于普通科学家的特质?
收藏 IP: 43.227.139.*| 热度|

9 杨正瓴 武夷山 王崇臣 孟佳 曾杰 黄永义 孙颉 许培扬 杨金波

该博文允许注册用户评论 请点击登录 评论 (6 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-3-19 16:27

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部