博文

年底比年初的论文的被引次数少20% 精选

已有 9281 次阅读 2020-4-1 14:28 |系统分类:科研笔记

说明：本博客与微信公众号“林墨”同步更新，所有内容均为原创，可授权转载请扫码关注“林墨”公众号。

注：图片来源于推特@Scopus对于一项研究《The Citation Trap: Papers Published at Year-End Receive Systematically Fewer Citations》的报道。

马超/ 东南大学

学者们都很关注自己论文的被引次数，毕竟它可能事关荣誉、薪水、头衔、项目。但你可能从来没有想过，同样水平的论文，如果不巧发在年底，被引次数会打个8折哦。

文献检索系统导致的 Citation Trap

为什么会这样呢？我们举个例子，今天是2020.3.31，假设你想搜某个话题近5年的研究，多数情况下你会以2016.1.1作为起点，而不是从2016.3.31开始。这种搜索习惯，会让年底文章被暴露在搜索中的时间少于年初的文章。年末和年初发表的论文在检索中会有多大差别？假设A文章发表于2015.12，B文章发表于2016.1，A文章会在2015.12月、2016全年、2017全年、2018全年、2019全年这49个月处在检索时间范围内，到了2020年，人们搜索近5年的文章就不会再搜索2015年的研究，因此A不在检索范围内。而B文章，会在2016.1-2020.12这60个月中全处在检索时间范围内。所以，B比A晚发表一个月，却能比A多被人检索11个月，因此也会有更大概率被引用。这样由于搜索而造成年末论文被引更少的现象，我们定义它为Citation Trap！

其实，学术搜索引擎也在一直误导大家去制造Citation Trap。不信你去登一下Google Scholar，页面左侧是“Since 2016”、“ Since 2019”，而不是“recent 4 years”、“recent 1 year”。其他学术搜索引擎，如WoS、Jstor也都类似。你按照他们的界面点击鼠标，就已经在制造Citation Trap。

年末发表文章的被引次数要少约20%

我们收集了1956年-2010年期间Web of Science上的经济学论文，剔除掉关键变量缺失的样本，以及AERpp这种特殊月份的特刊，共有样本208,977篇。我们进行了回归分析：因变量是log(被引次数+0.0001)，核心变量是Year-end（1=年末，10-12月；0=其他月份），再加了一系列控制变量（比如标题长短、论文页数、作者人数、参考文献数量、作者首字母排序、是否是卷首论文等），以及年份固定效应和期刊固定效应之后，结论显示，相比于非年末，年末发表文章的被引次数要少约20%。

随后，我们做了一系列稳健性检验，以保证主结果的可信。我们分别去除了0值、去除了最高引5%的；将OLS改为Nb-reg、Inv-sine；将年末的定义从10-12月改为12月、11-12月、9-12月、8-12月、7-12月；将核心变量由是否年末的0-1变量，改成以1月为基准，11个月份的虚拟变量去回归。均发现越是年末的月份，引用显著越少。

到这里，可能还不是让你信服。因为年末的文章比年初的文章后发表，后发表当然被引的少，被引少到底是Citation Trap还是仅仅因为出现的晚？我们随后通过构造新的“年”来打消这一疑虑：正常的“年”是从1月到12月，我们构造的年“Oct-Year”，是指用前一年的10月作为一年的起始，用当年的9月作为一年的末尾。这样的好处是，在进行上述回归时，是用当年的1-9月vs.前一年的10-12月，也就是说年末的文章其实比年初的文章早发表了好几个月，如果还发现负的显著，那就说明年末被引次数少不是因为出现的晚这一原因。同理，还可以构造“Dec-Year”、“Nov-Year”等。这种设定也可以认为是citation trap的下界，下界大概是10%。

随后我们又通过数据验证了，并不存在老练的学者（团队）有意识把论文发在年初的现象；期刊编辑也没有对年初年末有不同的安排；论文出现在搜索引擎的位置也不会影响本文结论。一切都指向一个证据——论文发在年末，引用次数就少。

是Citation Trap 导致的结果吗？

到此为止，读者应该对“年末论文引用次数少于年初论文”这一结论买账，但还无法说明，这一结论是由于检索导致的Citation Trap，还是其他不可观测因素导致。我们用了两个suggestive evidence来验证：

（1）如果是检索导致的Citation Trap，那么这种效应应该随着时间推移越来越明显。因为越是当代，越依赖于“网络检索”。

（2）如果是检索导致的Citation Trap，那么Top期刊这种效应小，非Top期刊这种效应大。因为Top期刊有一群忠实读者，他们会盯着每一期看，而非Top期刊上的论文被人读到，更依赖于“检索”。

我们验证了上述2点，从而给出了一个完整的Citation Trap的故事。

基于“机会平等理论”的解释

至于这篇经济学研究的政策含义呢，其实经济哲学里有个著名的机会平等理论，大意是个体所珍视的“优势”（比如收入、地位、健康等），由两方面因素决定：自己无力控制的称为“环境”，自己可控的称为“努力”。如果“优势”上的不平等是由“努力”因素造成的，这在道德上很合理；如果是由“环境”因素带来的，那么就是机会的不平等。在现实生活中，“环境”究竟对一个人的“优势”起到多大作用，是不同派系学者们争论的焦点。例如，精英主义者通常认为自己所获得的一切全靠“努力”得来；而罗尔斯主义者则倾向于强调“环境”的作用，因此需要通过社会政策的调节来给大家提供平等的机会。

这项研究实际上考察了经济学家们所珍视的“优势”（论文被引次数），是如何被某一细小“环境”（论文被排在了年初还是年末）所左右的。纵然经济学家们可以非常“努力”地写出高质量的论文并发表，但你看，一个小小的“环境”居然就左右了20%的“优势”，精英主义者们又怎能拍着胸脯心安理得地说，我所有的成功都moral deserve？

Ma, C., Li, Y., Guo, F., & Si, K. (2019). The citation trap: Papers published at year-end receive systematically fewer citations. Journal of Economic Behavior & Organization, 166, 667-687.

转载本文请联系原作者获取授权，同时请注明本文来自李江科学网博客。
链接地址：https://blog.sciencenet.cn/blog-1792012-1226353.html

上一篇：来中国后，他们发表了更多的论文
下一篇：诺贝尔奖得主有哪些异于普通科学家的特质？

收藏 IP: 43.227.139.*| 热度|

林墨分享 http://blog.sciencenet.cn/u/ZJUlijiang 分享以科学家为对象的研究论文

博文

年底比年初的论文的被引次数少20% 精选

说明：本博客与微信公众号“林墨”同步更新，所有内容均为原创，可授权转载请扫码关注“林墨”公众号。

当前推荐数：9 推荐人：杨正瓴 武夷山 王崇臣 孟佳 曾杰 黄永义 孙颉 许培扬 杨金波

该博文允许注册用户评论请点击登录评论 (6 个评论)

李江

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

相关博文

林墨分享 http://blog.sciencenet.cn/u/ZJUlijiang 分享以科学家为对象的研究论文

博文

年底比年初的论文的被引次数少20% 精选

说明：本博客与微信公众号“林墨”同步更新，所有内容均为原创，可授权转载请扫码关注“林墨”公众号。

当前推荐数：9 推荐人： 杨正瓴 武夷山 王崇臣 孟佳 曾杰 黄永义 孙颉 许培扬 杨金波

该博文允许注册用户评论 请点击登录 评论 (6 个评论)

李江

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

相关博文

当前推荐数：9 推荐人：杨正瓴武夷山王崇臣孟佳曾杰黄永义孙颉许培扬杨金波

该博文允许注册用户评论请点击登录评论 (6 个评论)