|||
从1955年到现在,SCI数据库中的论文数量是4千万篇(41425556),如果你用作者进行分析,可以发现发表论文最多的一个人是ANONYMOUS,这可不是一个人名,实际是无名氏,也就是说有89万篇论文是没有作者的。这真的很奇怪,怎么会有那么多论文没有作者?要知道这可是学术论文,他们是想做无名英雄吗?还是觉得论文没有价值,不好意思署名。
无名氏的文章并不是我真正想说的问题,请看看排在前10名的作者名单,除第四名为SUZUKI T以外,几乎全部是中国人的名字。其中姓wang的有三个,姓Zhang 和Li分别有2个。这些名字有一个特点,全部是2个字的名字。这应该是一个值得注意的问题。
出现这种现象的原因有:一是国际上对我国学者的姓名规则不熟悉,许多杂志把我们的姓名中3个字简化成2个字,例如wang youbin。经常被简化为Wang Y,有的时候把名字和姓颠倒过来。这是导致这种姓加一个字母的名字出现的概率特别大,而且大量出现重名的现象。因此可以肯定地说,前面10个作者没有一个是一个作者的,都是无数同名的作者和群体。当然一是需要数据库在作者识别上提高技术手段,以减少这类重叠的现象。二是我们在撰写论文的时候规范署名方式。根据国际惯例,中国人的名字最应该的标注方式是姓加每个字都大写的名字。这样的方式可能比较理想。
国际上标注作者的方式是姓全称,名简称。这符合国际上的姓多名少的规律。因为重姓的相对几率比较小,这样在作者识别上,非亚洲国家的名字区分度就比较大,也就是说重名的相对比较少。而我们亚洲人,典型的是中国和日本,主要是以名字为区分度,而姓相对比较少,尽管中国有1000个姓不止,但常见的姓就那么几个。所以造成这样的一个假象,体现在数据库就出现这样的景象。将来一方面我们尽量按照国际惯例标注作者名字,另一方面最好是能使用全名好一些。
ANONYMOUS 889615 2.148
WANG Y 27571 0.067
ZHANG Y 25127 0.061
WANG J 23725 0.057
SUZUKI T 22237 0.054
LI J 21314 0.051
LI Y 21304 0.051
LIU Y 21066 0.051
ZHANG J 20691 0.050
WANG L 18104 0.044
LEE J 18091 0.044
TANAKA K 17950 0.043
KIM JH 17824 0.043
ZHANG L 17755 0.043
KIM J 16941 0.041
SUZUKI K 16913 0.041
LEE JH 16731 0.040
LEE S 16444 0.040
CHEN J 16373 0.040
CHEN Y 16045 0.039
NAKAMURA T 15892 0.038
WANG H 15778 0.038
TANAKA T 15647 0.038
WATANABE T 15564 0.038
SATO T 15440 0.037
KUMAR A 15162 0.037
YAMAMOTO T 15058 0.036
LIU J 14844 0.036
TANAKA M 14804 0.036
KIM S 14740 0.036
LI L 14472 0.035
SUZUKI M 14330 0.035
KIM SH 14288 0.034
LEE SH 14259 0.034
TANAKA H 14191 0.034
KUMAR S 14125 0.034
TAKAHASHI K 13825 0.033
SATO K 13676 0.033
KOBAYASHI T 13656 0.033
TAKAHASHI T 13523 0.033
ZHANG H 13233 0.032
YAMAMOTO K 13220 0.032
SUZUKI Y 13041 0.031
KIM H 13007 0.031
SUZUKI H 12875 0.031
WATANABE K 12749 0.031
TAKAHASHI M 12736 0.031
WANG X 12421 0.030
TANAKA Y 12283 0.030
NAKAMURA Y 12090 0.029
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 14:53
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社