|||
科学文献的使用历史:Nature Metrics与Nature论文的计量研究
2013年10月中旬,刚好是我博士毕业4年整的时候,收到工作以来第10篇SSCI论文的录用通知。几个小时之后,又收到另外一篇论文的修改意见。10月果然是收获的季节。
刚录用的是一篇关于科学文献的用户数据研究的论文。从去年以来,我们开展了一系列关于科学文献用户数据的研究。
长久以来,出版社和数据库一般都不会公布论文的被下载次数。近年来,论文的用户数据得到了来自学术界和出版界的重视。例如,中国知网CNKI会公布每一篇论文的被下载次数,当然数据的更新比较慢。
国外的主流学术出版商有Elsevier、Springer、Wiley等,Elsevier占据全球STM文献20-25%的市场份额,Springer占据15-20%。其中Springer的realtime平台可以实时显示论文的被下载情况,但是这三家出版商都没有提供每一篇论文的被下载次数。
在这方面走在前面的是PLOS,PLOS系列期刊都会显示每一篇论文的下载次数,包括HTML全文查看次数、PDF下载次数、XML下载次数。除了下载总次数之外,PLOS还会提供论文在发表后每一个月的下载次数。
图1 PLOS期刊的论文下载次数统计
而Nature则在PLOS的基础上又往前进了一大步。2012年10月31日,Nature正式推出Nature Metrics指标(http://www.nature.com/news/nature-metrics-1.11681)。
对于Nature主刊以及一系列子刊从2012年1月1日起发表的研究性论文,(包括Article、Letter、Review、BriefCommunication、Perspective、Correspondence),都提供每一篇文章的articlemetrics指标。具体指标有被引次数、Altmetric得分、Pageviews。关于Altmetric得分我以后会专门写一篇文章介绍。那么,Nature的pageviews除了显示每篇文章的被下载总数之外,还能详细到每一天的下载数量。
图2 Nature Metrics
如果我们能知道一篇论文发表之后被下载多少次,以及详细到每一天被下载多少次。相比较于传统的论文被下载瓷塑化的简单统计,我们认为这是一种新的动态用户数据类型。这样的数据对于科学计量学来说,无疑是全新的数据类型。我们利用Nature的这个数据,分析了2012年发表在Nature主刊上180多篇文章的被下载情况,完成了一项研究“Usage History of Scientific Literature: Nature Metrics and Metrics of NaturePublications”。
根据我们的研究结果,Nature的论文刚发表会受到非常大的关注。论文发表之后的7天内被下载次数占到总次数的50以上,30天之内的下载次数更是占到总次数的70%以上。论文在发表3个月之后,基本上就不会有太多的新增下载次数了。当然,关于下载规律背后的原因和机理还有待进一步探讨。
并且,基于论文在发表之后一段时间以内的下载数量,可以较好地预测它将来可能达到的下载次数总量。
此外,相较于普通的论文,开放获取的论文不仅下载总次数要高出很多,而且在较长时间之后仍然可以保持较高的下载量。也就是说,开放获取的论文比普通论文要更持久地受到大家的关注。
这篇论文已经被Scientometrics录用,论文可以从arXiv免费下载。
http://arxiv.org/abs/1304.7653
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 10:29
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社