|||
观察 | 数据看北大清华同世界一流大学的差距
文 | 贺飞(北京大学)
【本文2016年11月13日首发于“里瑟奇智库”微信公众号,原文请点击“阅读原文”】
近年来,文献计量学指标越来越多的被应用于科研绩效评价中。一般来说,没有任何一个单一的文献计量学指标能全面的评价科研绩效,通常会选取一组恰当的文献计量学指标,更加全面,视野更为开阔地多角度深入挖掘数据内涵。本文利用原汤森路透新一代研究分析平台InCites,选取多项文献计量指标,将美国新闻与世界报道2016年世界大学排名前5的大学同北京大学(53)和清华大学(57)两所学校进行了全面的比较,读者可以从中管窥北大清华同世界一流大学的差距。本文数据检索时间为2016年11月10日,文献类型为Article 和 Review两种类型。
1、2016年美国新闻与世界报道排名前5名的大学排名 | 英文名 | 中文名 |
1 | Harvard University | 哈佛大学 |
2 | MIT | 麻省理工学院 |
3 | Stanford University | 斯坦福大学 |
4 | University of California--Berkeley | 加州大学伯克利分校 |
5 | California Institute of Technology | 加州理工学院 |
53 | Peking University | 北京大学 |
57 | Tsinghua University | 清华大学 |
2、论文总数
学校/年 | 1995 | 2000 | 2005 | 2010 | 2015 |
哈佛 | 8186 | 10658 | 12965 | 17947 | 21634 |
MIT | 2924 | 3233 | 4109 | 5220 | 6762 |
斯坦福 | 3440 | 4457 | 5367 | 6991 | 9140 |
伯克利 | 3776 | 4382 | 5304 | 6631 | 7667 |
加州理工 | 1748 | 2260 | 2622 | 3044 | 3314 |
北京大学 | 656 | 1551 | 2799 | 4628 | 7807 |
清华大学 | 368 | 1311 | 3613 | 4365 | 8126 |
3、总引用数
学校/年 | 1995 | 2000 | 2005 | 2010 | 2015 |
哈佛 | 664536 | 859086 | 909959 | 698170 | 85422 |
MIT | 205324 | 259446 | 294214 | 238270 | 29240 |
斯坦福 | 249403 | 366593 | 319871 | 257090 | 35246 |
伯克利 | 202024 | 286613 | 291059 | 248493 | 28120 |
加州理工 | 113038 | 156983 | 159166 | 132912 | 14831 |
北京大学 | 7421 | 27396 | 74240 | 92357 | 18920 |
清华大学 | 4855 | 20719 | 67104 | 82080 | 18951 |
4、篇均引用
学校/年 | 1995 | 2000 | 2005 | 2010 | 2015 |
哈佛 | 81.18 | 80.60 | 70.19 | 38.90 | 3.95 |
MIT | 70.22 | 80.25 | 71.60 | 45.65 | 4.32 |
斯坦福 | 72.50 | 82.25 | 59.60 | 36.77 | 3.86 |
伯克利 | 53.50 | 65.41 | 54.88 | 37.47 | 3.67 |
加州理工 | 64.67 | 69.46 | 60.70 | 43.66 | 4.48 |
北京大学 | 11.31 | 17.66 | 26.52 | 19.96 | 2.42 |
清华大学 | 13.19 | 15.80 | 18.57 | 18.80 | 2.33 |
5、学科规范化引文影响力(CNCI)
指标解释:
所谓一篇文献的学科规范化的引文影响力(Category Normalized Citation Impact),是通过其实际被引次数除以同文献类型、同出版年、同学科领域的期望被引次数获得的。当一篇文献被划归至多于一个学科领域时,则使用实际被引次数与期望被引次数比值的平均值。一组文献的CNCI,例如某个人、某个机构或国家,是该组中每篇文献CNCI的平均值。
其中e=期刊引用率或基线,c=总被引次数,p=;论文总数,f=学科领域,t=出版年,d=文献类型,n=论文被划归的学科领域数,i=被评估的实体的编号(机构、国家、个人等)。CNCI是一个十分有价值且无偏的影响力指标,它排除了出版年、学科领域与文献类型的影响。如果CNCI的值等于1,说明该组论文的被引表现与全球平均水平相当;CNCI大于1表明该组论文的被引表现高于全球平均水平;小于1,则低于全球平均水平。CNCI等于2,表明该组论文的平均被引表现为全球平均水平的2倍。由于CNCI是一个排除了出版年、学科领域与文献类型的作用的无偏影响力指标,因此使用它可以进行不同规模、不同学科混合的论文集的比较。
各校的CNCI数据
学校/年 | 1995 | 2000 | 2005 | 2010 | 2015 |
哈佛 | 2.24 | 2.11 | 2.09 | 2.16 | 2.21 |
MIT | 2.44 | 2.51 | 2.59 | 2.60 | 2.26 |
斯坦福 | 2.44 | 2.40 | 2.14 | 2.23 | 2.21 |
伯克利 | 2.04 | 2.09 | 2.08 | 2.25 | 1.96 |
加州理工 | 2.16 | 2.29 | 2.22 | 2.34 | 2.03 |
北京大学 | 0.50 | 0.67 | 1.05 | 1.21 | 1.28 |
清华大学 | 0.70 | 0.71 | 0.84 | 1.21 | 1.28 |
6、国际合作论文数以及国际合作论文占比
指标解释:
所谓国际合作论文(International Collaboration)是指包含一位或多位国际共同作者的论文。国际合作论文百分比(% of International Collaborations)是某论文集(如上描述)中,国际合作论文的数量除以该论文集的论文总数的数值,以百分数的形式表现。国际合作论文百分比指标体现了机构或科研工作者吸引国际合作的能力。
国际合作论文数
学校/年 | 1995 | 2000 | 2005 | 2010 | 2015 |
哈佛 | 1446 | 2752 | 4030 | 6743 | 10169 |
MIT | 672 | 991 | 1380 | 2182 | 3512 |
斯坦福 | 662 | 1112 | 1474 | 2344 | 4020 |
伯克利 | 828 | 1302 | 1788 | 2758 | 3748 |
加州理工 | 431 | 831 | 1062 | 1612 | 1914 |
北京大学 | 120 | 355 | 732 | 1615 | 2842 |
清华大学 | 68 | 293 | 606 | 1131 | 2742 |
国际合作论文占比
学校/年 | 1995 | 2000 | 2005 | 2010 | 2015 |
哈佛 | 17.66% | 25.82% | 31.08% | 37.57% | 47.00% |
MIT | 22.98% | 30.65% | 33.58% | 41.80% | 51.94% |
斯坦福 | 19.24% | 24.95% | 27.46% | 33.53% | 43.98% |
伯克利 | 21.93% | 29.71% | 33.71% | 41.59% | 48.88% |
加州理工 | 24.66% | 36.77% | 40.50% | 52.96% | 57.75% |
北京大学 | 18.29% | 22.89% | 26.15% | 34.90% | 36.40% |
清华大学 | 18.48% | 22.35% | 16.77% | 25.91% | 33.74% |
7、平均百分位
指标解释:
一篇论文的百分位是通过建立同出版年、同学科领域、同文献类型的所有论文的被引频次分布(将论文按照被引频次降序排列),并确定低于该论文被引次数的论文的百分比获得的。如果一篇论文的百分位值为1,则该学科领域、同出版年、同文献类型中99% 的论文的引文数都低于该论文。百分位是一个规范化的指标,一篇论文的百分位体现了其在同学科、同出版年、同文献类型的论文集中的相对被引表现。
对于一组论文来说,平均百分位可以通过计算该组论文中所有论文的百分位的平均值而获得。当一篇论文被划归至多个学科领域时,使用百分位值最接近0的学科领域的百分位值(最佳表现值)。
平均百分位
学校/年 | 1995 | 2000 | 2005 | 2010 | 2015 |
哈佛 | 33.42% | 33.81% | 33.60% | 35.13% | 48.86% |
MIT | 31.80% | 31.04% | 31.73% | 30.88% | 47.79% |
斯坦福 | 32.69% | 32.99% | 33.44% | 35.23% | 49.62% |
伯克利 | 34.41% | 33.52% | 34.99% | 35.35% | 48.90% |
加州理工 | 32.82% | 31.74% | 32.33% | 32.12% | 45.68% |
北京大学 | 66.35% | 59.20% | 52.26% | 46.01% | 58.72% |
清华大学 | 52.96% | 54.12% | 56.85% | 46.97% | 58.77% |
8、论文被引百分比
论文被引百分比指标是一组出版物中至少被引用过一次的论文占总论文数的百分比。这个指标揭示了某科研领域其他科研工作者引用本机构科研成果的程度。另一种阐释这个指标的角度是,可以得到相应的没有得到过引用的论文的百分比。需要注意的是,论文被引百分比指标将会根据分析中包含的时间段和文献类型而发生变化。论文被引百分比不是一个规范化的指标。例如,如果分析中包含当年或近年发表的论文,其中的某些文献可能没有足够长的时间来积累引文。
论文被引百分比
学校/年 | 1995 | 2000 | 2005 | 2010 | 2015 |
哈佛 | 96.18% | 98.83% | 96.95% | 93.32% | 69.00% |
MIT | 95.31% | 95.73% | 95.45% | 94.67% | 69.59% |
斯坦福 | 95.44% | 95.54% | 96.18% | 92.66% | 67.67% |
伯克利 | 94.65% | 95.73% | 94.25% | 92.63% | 69.14% |
加州理工 | 95.59% | 96.68% | 96.30% | 96.325 | 74.26% |
北京大学 | 76.52% | 86.78% | 90.5% | 92.09% | 59.73% |
清华大学 | 85.60% | 89.78% | 83.03% | 89.97% | 58.66% |
9、被引次数排名前1%的论文百分比、被引次数排名前10%的论文百分比
指标解释:
被引次数排名前1%的论文百分比指标是在某一指定学科领域、某一年、某种文献类型下,被引频次排名前1%的文献数除以该组文献的总数的值,以百分数的形式展现。该指标数值越大,表明该组文献表现越好。 如果某组论文该指标值等1%,说明该组论文中有1%的论文位于全球同类论文(同一学科、出版年和文献类型)被引次数排名的前1%,也说明这组论文的水平与全球平均水平相当。一个高于1%的值,代表该组论文中超过1%的论文位于全球同类论文排名的前1%,同样的,一个低于1%的值代表该组论文中不足1%的论文位于全球同类论文排名的前1%。
被引次数排名前1%的论文百分比指标通常被认为是反映高水平科研的指标,因为只有那些高被引论文才能在相应的学科领域、出版年与文献类型中排名前1%。这组指标可以与其他指标一起使用,以提供更为全面的科研绩效蓝图。被引次数排名前1%的论文百分比指标可以被应用于任何层级的论文集(作者、机构、国家/国际、学科领域)。
当然,尽管排名前1%可以衡量高水平科研,但是从本质来讲,它通常只代表了一组论文集中很少一部分,因此小样本量的统计学相关性成为该指标的一个重要问题。因此,被引次数排名前1%的论文百分比最好与大样本量数据集一起使用,例如某机构、国家或地区在若干年内累积的论文。
被引次数排名前10%的论文百分比与被引次数排名前1%的论文百分比十分类似,只是将阈值从1%变为10%。此时,评估的基准是10%,高于10%将被认为高于平均绩效水平。这两个指标互相补充,提供了更为宽泛的优秀科研(10%)与杰出科研(1%)的全景图。
从上一个指标的分析可以看出,当数据集较小的时候,使用被引次数排名前10%的论文百分比,比使用被引次数排名前1%的论文百分比更为合适。当然,对于大中型数据集该指标同样适用。但是,在用来分析小型数据集,如个人研究产出时应该谨慎使用。
被引频次排名前1%的论文百分比
年 | 1995 | 2000 | 2005 | 2010 | 2015 |
哈佛 | 4.43% | 4.16% | 4.33% | 5.26% | 4.33% |
MIT | 4.89% | 5.13% | 5.94% | 6.82% | 5.15% |
斯坦福 | 4.30% | 5.03% | 4.53% | 4.59% | 4.25% |
伯克利 | 3.42% | 3.61% | 4.03% | 5.01% | 3.86% |
加州理工 | 3.55% | 5.00% | 4.84% | 5.39% | 3.74% |
北京大学 | 0.46% | 0.52% | 1.57% | 1.75% | 1.92% |
清华大学 | 0.27% | 0.23% | 1.25% | 1.72% | 1.98% |
被引频次排名前10%的论文百分比
年 | 1995 | 2000 | 2005 | 2010 | 2015 |
哈佛 | 27.38% | 26.24% | 26.76% | 26.70% | 26.61% |
MIT | 28.18% | 29.29% | 29.52% | 32.26% | 21.75% |
斯坦福 | 27.82% | 27.93% | 26.68% | 26.68% | 20.67% |
伯克利 | 25.05% | 24.24% | 24.70% | 25.59% | 19.72% |
加州理工 | 24.77% | 27.08% | 28.18% | 28.19% | 21.18% |
北京大学 | 3.35% | 6.83% | 11.75% | 13.66% | 12.27% |
清华大学 | 6.52% | 6.86% | 9.16% | 14.25% | 13.16% |
10、期刊规范化的引文影响力(JNCI)
指标解释:
期刊规范化的引文影响力(Journal Normalized Citation Impact)与学科规范化的引文影响力类似,主要区别在于JNCI对论文发表在特定期刊上的被引次数进行了规范化,但未对研究领域进行规范化。每篇论文的JNCI为该论文的实际被引频次与其发表的期刊同出版年、同文献类型论文的平均被引频次的比值。一组论文的JNCI值为每篇论文JNCI值的平均值。JNCI指标能够提供某篇论文(或某组论文)与其他研究人员发表在同一期刊(或同一组期刊)上的成果的比较信息。指标主要回答“我的论文在所发表期刊上表现如何?”之类的问题。如果JNCI的值超过1,说明该其影响力高于平均值,如果JNCI的值低于1,说明其影响力低于平均值。JNCI对于出版商评价论文发表后的影响力水平也十分有用,它揭示出那些超过平均水平并提高了期刊被引频次的研究工作。
JNCI是一个相对的科研绩效评估指标,尽管其在很多情况下可能与CNCI正相关,但这并不总是成立。例如,如果一个研究人员的CNCI指标高于平均值,JNCI指标低于平均值,很可能意味着他在其论文发表的科研领域获得了比平均水平更多的引用,但是他所发表的期刊具有非常高的被引频次(如《science》、《nature》),因此他/她的论文被引频次低于这本期刊上论文的平均被引频次。
期刊规范化的引文影响力
学校/年 | 1995 | 2000 | 2005 | 2010 | 2015 |
哈佛 | 1.25 | 1.27 | 1.25 | 1.22 | 1.21 |
MIT | 1.42 | 1.45 | 1.50 | 1.37 | 1.23 |
斯坦福 | 1.40 | 1.41 | 1.39 | 1.27 | 1.22 |
伯克利 | 1.25 | 1.34 | 1.29 | 1.31 | 1.28 |
加州理工 | 1.24 | 1.47 | 1.39 | 1.41 | 1.37 |
北京大学 | 0.85 | 0.92 | 1.06 | 1.06 | 1.04 |
清华大学 | 0.85 | 0.91 | 0.93 | 1.10 | 1.08 |
11、高被引论文数、高被引论文百分比
指标解释:
高被引论文(Highly Cited Papers)是指按领域和出版年统计的引文数排名前1%的论文(含研究论文与综述)。
高被引论文百分比指标则是用某一论文集(论文、作者、机构、国家、期刊、学科领域)内的ESI高被引论文数除以该文献集中论文总数,以百分数形式展现。其可用于评价高水平科研,并能展示某一机构论文产出在全球最具影响力的论文中的百分比情况。
高被引论文数
年 | 2006 | 2007 | 2008 | 2009 | 2010 | 2011 | 2012 | 2013 | 2014 | 2015 |
哈佛 | 600 | 580 | 684 | 710 | 831 | 833 | 978 | 953 | 1015 | 954 |
MIT | 204 | 201 | 239 | 228 | 278 | 334 | 364 | 357 | 389 | 334 |
斯坦福 | 208 | 241 | 277 | 250 | 318 | 337 | 333 | 377 | 429 | 409 |
伯克利 | 200 | 175 | 239 | 257 | 284 | 324 | 298 | 318 | 339 | 308 |
加州理工 | 119 | 116 | 96 | 109 | 139 | 145 | 152 | 148 | 161 | 135 |
北京大学 | 37 | 37 | 61 | 61 | 70 | 86 | 98 | 150 | 156 | 163 |
清华大学 | 47 | 38 | 51 | 69 | 75 | 94 | 107 | 129 | 153 | 154 |
高被引论文占比
年 | 2006 | 2007 | 2008 | 2009 | 2010 | 2011 | 2012 | 2013 | 2014 | 2015 |
哈佛 | 4.24% | 3.93% | 4.23% | 4.18% | 4.63% | 4.24% | 4.77% | 4.50% | 4.59% | 4.41% |
MIT | 4.68% | 4.52% | 5.17% | 4.72% | 5.33% | 5.64% | 6.09% | 5.62% | 5.85% | 4.94% |
斯坦福 | 3.70% | 4.02% | 4.41% | 3.75% | 4.55% | 4.50% | 4.28% | 4.58% | 5.00% | 4.47% |
伯克利 | 3.76% | 3.21% | 4.15% | 4.01% | 4.28% | 4.61% | 4.04% | 4.32% | 4.40% | 4.02% |
加州理工 | 4.25% | 3.98% | 3.52% | 3.71% | 4.57% | 4.51% | 4.56% | 4.44% | 4.73% | 4.07% |
北京大学 | 1.24% | 1.14% | 1.67% | 1.42% | 1.51% | 1.70% | 1.69% | 2.22% | 2.18% | 2.09% |
清华大学 | 1.27% | 1.07% | 1.34% | 1.63% | 1.72% | 1.91% | 1.97% | 1.98% | 2.15% | 1.90% |
12、热点论文百分比
指标解释:
热点论文百分比(% Hot Papers):入选ESI热点论文(按领域和时间段统计的引文数排名前0.1%)的出版物百分比。
热点论文百分比
学校/年 | 2014年 | 2015年 |
哈佛 | 0.34% | 0.75% |
MIT | 0.54% | 0.83% |
斯坦福 | 0.36% | 0.79% |
伯克利 | 0.27% | 0.40% |
加州理工 | 0.26% | 0.66% |
北京大学 | 0.08% | 0.29% |
清华大学 | 0.11% | 0.33% |
13、与企业合作论文百分比
指标解释:
与企业合作论文百分比就是横向合作论文百分比(%of Industry Collaborations),一篇横向合作的论文,是指那些包含了一位或多位组织机构类型标记为“企业”的作者的出版物。与企业合作论文百分比是某一论文集与企业合作发表文献数除以该论文集合中论文总数的数值,以百分数的形式表现。
需要注意的是,目前InCitesTM中并未统一所有论文包含的每一机构的隶属关系,只有那些已被统一的机构才能被标记特定的组织机构类型。因此,可能存在一些企业,其隶属关系未被统一而没有被标记组织机构类型为“企业”或其他,其发表论文未被标记为与企业合作论文。目前统计结果可能只限于大型跨国企业,因此可能存在区域偏差。
与企业合作论文百分比
学校/年 | 1995 | 2000 | 2005 | 2010 | 2015 |
哈佛 | 2.22% | 3.12% | 3.19% | 3.55% | 3.02% |
MIT | 3.90% | 5.82% | 3.58% | 5.08% | 3.93% |
斯坦福 | 4.62% | 4.73% | 4.55% | 3.93% | 3.59% |
伯克利 | 3.20% | 3.49% | 2.55% | 2.52% | 2.14% |
加州理工 | 2.46% | 3.67% | 2.90% | 2.23% | 2.32% |
北京大学 | 0.46% | 0.64% | 1.43% | 1.40% | 1.60% |
清华大学 | 0.00% | 0.53% | 1.16% | 1.79% | 1.48% |
14、相对世界影响力
指标解释:
相对世界影响力是相对于全球平均水平的影响力(ImpactRelative to World),某组论文的引文影响力与全球总体出版物的引文影响力的比值。这个指标可以被用于机构、国家和全球水平。这个指标展示了某项研究的影响力与全球研究影响力的关系,反映了相对的科研绩效水平。全球平均值总是等于1。如果该比值大于1,即表明该组论文的篇均被引频次高于全球评价水平;小于1,则低于全球平均水平。
相对影响力=引文影响力(即篇均引用)÷基线(全球引文影响力)
不过,这个指标虽然考虑了出版年份的因素,但由于机构或国家同时在多个学科发表论文,该指标却忽略了这些学科之间的差异。
相对世界影响力
年 | 1995 | 2000 | 2005 | 2010 | 2015 |
哈佛 | 4.752 | 4.236 | 4.346 | 4.022 | 3.596 |
MIT | 4.111 | 4.217 | 4.433 | 4.719 | 3.938 |
斯坦福 | 4.244 | 4.322 | 3.690 | 3.802 | 3.512 |
伯克利 | 3.132 | 3.437 | 3.398 | 3.874 | 3.340 |
加州理工 | 3.785 | 3.650 | 3.759 | 4.514 | 4.076 |
北京大学 | 0.662 | 0.928 | 1.642 | 2.063 | 2.207 |
清华大学 | 0.772 | 0.831 | 1.150 | 1.944 | 2.124 |
(转载请注明出处,联系作者st69786@tom.com)
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-25 07:14
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社