最近关于国际上个主要国家发表论文数量的数据陆续出台,最引人注目的应该是中国科学技术信息研究所公布的关于中国学术论文的年度报告,其次是路透公司科学观察网上公布的信息,这些资料有一定重复性,但也可能有一些不够严谨。
特别是我发现关于中国论文数量的统计存在几个不一致的地方。
首先对比一下资料:
中国科学技术信息研究所12月2日在北京发布2010年中国科技论文统计结果。
2001年至2011年(截至2011年11月1日)我国科技人员共发表论文83.63万篇,排在世界第2位,比2010年统计时上升2位;论文共被引用519.14万次,排在世界第7位,比2010年统计时上升1位。 我国平均每篇论文被引用6.21次,比上年度统计时的5.87次提高了5.8%。
“科学观察”网站根据各个国家和地区于2001年1月至2011年8月31日在汤森路透索引期刊上发表的论文,统计分析出前20名国家和地区排名。有60个参与排名的国家和地区在这期间发表的论文数超过1万篇。排名参照指标为论文数、总被引次数和单篇文章被引次数。其中,中国的论文数排名第2,总被引数列第7,而单篇文章被引次数仍未进前20。其中公布的数据为:PEOPLES R CHINA论文数量为 836,255,总引用次数5,191,358,平均被引用次数6.21。
上述两组数据惊人地相似,是否可以大胆推测,中国科学技术信息研究所的统计数据就是对科学观察公布数据的直接引用。引用数据当然没有问题,而且这些数据是来自最有力度的路透公司,应该是最能体现客观性和真实性的。不过引用最重要的是要准确,但这里出现了一个时间上的误差,请大家注意,科学观察的数据统计日期为至2011年8月31日,中国科学技术信息研究所的数据截至2011年11月1日,这两个时间点相差2个月,要知道两个月的论文数量是多少,按照目前的平均数量计算,大概有2-3万篇左右。那么一个简单的计算是,11月1日的论文数量应该是83.63+2=85.63,这个数据出入有多大?3%左右,这样的出入是不应该的。
我相信“中国科学技术信息研究所”是从事文献计量的专业单位,这样的低级错误不应该有,也许是我自己弄错了。
那么检索一下,看到底这些数据是怎么来的,今天已经到了12月8日,距离11月1日又过一个月,关于中国发表论文的数据应该是继续增加1-2万篇左右,但数据应该接近。
用2001-2011作为为年度检索,全世界的总数据是共 15270290。以下是前10名国家发表论文的数量统计表:
USA 4751754 31.118
GERMANY 1084005 7.099
ENGLAND 1080637 7.077
PEOPLES R CHINA 1011166 6.622
JAPAN 981504 6.428
FRANCE 730638 4.785
CANADA 644064 4.218
ITALY 600595 3.933
SPAIN 457175 2.994
AUSTRALIA 431938 2.829
这个数据中,美国的数量不准确,中国的数据更不正确,中国论文数量的国际排名也不正确,或者与公布的数据不匹配。
那么怎么回事情,自己胡乱猜测,也许是因为这些数据中包括许多非article的数据吧。那么把数据局限在article怎么样?限定为article后,全世界的论文数量被降低到10,679,483,减少了500万篇。不会吧?还是把数据展示一下吧。注意其中会议摘要有206万篇。
以下为各类论文种类的统计表。
ARTICLE 10679483 69.936
MEETING ABSTRACT 2065883 13.529
PROCEEDINGS PAPER 979724 6.416
EDITORIAL MATERIAL 784689 5.139
REVIEW 539738 3.535
LETTER 427693 2.801
BOOK CHAPTER 350195 2.293
BOOK REVIEW 337348 2.209
NEWS ITEM 242532 1.588
CORRECTION 103183 0.676
将数据限制在article以后,结果发现,前10名的国家为:
国家 论文数量 百分比
USA 3155338 29.546
PEOPLES R CHINA 933161 8.738
GERMANY 824811 7.723
JAPAN 809524 7.580
ENGLAND 729329 6.829
FRANCE 586320 5.490
CANADA 473591 4.435
ITALY 451141 4.224
SPAIN 361733 3.387
AUSTRALIA 321945 3.015
从2001到2011年中国发表论文被SCI收录数量为,927,025篇。具体到年度数量为:
年度 篇数 百分比
2010 135537 14.621
2011 133537 14.405
2009 122929 13.261
2008 107116 11.555
2007 93580 10.095
2006 84309 9.095
2005 70517 7.607
2004 58268 6.285
2003 47173 5.089
2002 39132 4.221
2001 34911 3.766
这个数据中,美国的数据很接近,但中国的数据差10万多,德国和日本尽管也低于这个数据,但都没有超过4万。
也许数据把国际合作的论文排除掉,当然这样不合理,最合理的解释是把非所有权的论文排除掉。但这个不知道如何检索,如果按照合作论文中有50%属于国外所有这样的比例,看结果如何。结果发现最近10年国际合作论文为21万篇左右,这样的估计大概就比较合理了。这些合作论文中有50%属于国外,50%属于中国,基本上比较符合。但要强调地是,这个数据只是推测,没有可靠的证据。
后记:
把分析数据限制在论文的处理结果有一个最大的好处,就是中国的排名从第4名一下子前进到第2名。如果你分析分析会议摘要的数据,就发现中国学者的这个数据是非常非常低的,过去曾经呼吁过我们要积极参加国际会议,特别是那些能被SCI收录的会议,原来单纯希望增加这个数据,现在看来是我们参与国际交流的热情存在问题,也许是因为我们出国不方便,这个问题需要引起重视。
2001-2011年各国SCI收录的会议摘要数量统计表
超过10万篇的有4个国家(红色),中国发表41349排11名,占国际总数量的2%
USA 831119 40.231
GERMANY 144436 6.991
ENGLAND 136310 6.598
JAPAN 113890 5.513
CANADA 82188 3.978
ITALY 79486 3.848
FRANCE 67924 3.288
NETHERLANDS 47582 2.303
SPAIN 45701 2.212
AUSTRALIA 42969 2.080
PEOPLES R CHINA 41349 2.002
SOUTH KOREA 34501 1.670
SWITZERLAND 32162 1.557
BRAZIL 31419 1.521
SWEDEN 24977 1.209
BELGIUM 23909 1.157
AUSTRIA 20168 0.976
POLAND 19753 0.956
TURKEY 18274 0.885
SCOTLAND 17966 0.870
DENMARK 16596 0.803
GREECE 16500 0.799
ISRAEL 15405 0.746
INDIA 14818 0.717
RUSSIA 14721 0.713
顺便分析分析最近10年中国发表被SCI收录的会议摘要情况吧。刚看到有几个老师讨论伪国际会议的问题,这些论文中显然也包括那些不参加只投稿的会议摘要。哪怕不用考虑这个因素,只从数量上就可以看出我们中国学者参加国际会议的热情十分低,十分差。
中国学者最近10年发表被SCI收录的会议摘要总数量为41349占全世界总数的2.002%,同时期美国学者的数据为 831119和40.231%,相差20倍!每年发表会议摘要的数量最多的是2010年发表6226篇,2011年比较少可能是因为会议摘要往往收录比较滞后。这与我们数据为15万的论文总数量是不匹配的,显得我们很象是闷头发表论文,不愿意进行学术交流。许多人说现在国际会议上中国学者的声音越来越大,看来是很不够大。
以下为中国学者发表会议摘要的年度数据。看出来尽管最近10年增加了3倍,但远远不如发表论文的稳定增加速度。
2010 6226 15.057
2006 5190 12.552
2008 5117 12.375
2009 5073 12.269
2004 4283 10.358
2007 3726 9.011
2011 3284 7.942
2003 2816 6.810
2005 2747 6.643
2002 1753 4.240