fuzzywanglixin的个人博客分享 http://blog.sciencenet.cn/u/fuzzywanglixin

博文

《自然》“小团队”vs“大团队”论文的误导性分析

已有 5973 次阅读 2019-2-19 10:25 |系统分类:观点评述

      几天来,《自然》论文“Large teams develop and small teams disrupt science and technology”在科学网上引发热议。华春雷博主的博文“《自然》发文揭开"大科学"背后的沉重真相”(http://blog.sciencenet.cn/blog-2910327-1162214.html )在短短的几天就有接近一万七千次的阅读量,这在日渐冷清的“科学网”上无疑是一道亮丽的风景线!另外,秦四清博主(http://blog.sciencenet.cn/blog-575926-1162524.html )、王善勇博主(http://blog.sciencenet.cn/blog-692836-1162576.html )、刘进平博主(http://blog.sciencenet.cn/blog-39731-1162228.html )等大侠们的精彩博文也备受关注。这些博文以及博文后面的评论有一个共同的特点,那就是接受《自然》论文的结论(小团队比大团队更有创新性),而没有对得出这个结论的依据提出科学的质疑。

      我读了这篇《自然》论文,觉得他们使用统计学技巧,给出了一个误导性的结论。具体地讲,他们使用percentile(百分位)做为比较的变量,而不是使用样本平均类指标(比如mean或者median);由于“小团队”论文的创新指数呈现严重的重尾分布(见《自然》论文Fig.2(b)的蓝色和绿色曲线),而“大团队”的论文要均衡许多(见《自然》论文Fig.2(b)的黄色曲线),所以使用percentile做为比较的变量会产生严重误导。从他们论文的Fig.3(a)就可以看出这个问题: median citations increase with team size (团队越大,引用的中位数越高),whereas the average disruption percentile decreases with team size (团队越大,创新指数的percentile越小)。

      用通俗一点的语言来讲,由于“小团队”论文的总数要远远地大于“大团队”论文的总数(见《自然》论文的Fig.8(a)(b)),在这些数量众多的“小团队”论文中,会出现少数非常具有创新性的论文,而绝大部分论文是垃圾,这就形成了“重尾分布”(《自然》论文Fig.2(b)的蓝色和绿色曲线)。“大团队”论文在创新性上比较平均,呈“均衡分布”(《自然》论文Fig.2(b)的黄色曲线)。如果只是比较“重尾分布”和“均衡分布”的尾部(percentile指标),会得出一种结论(《自然》论文的结论),而如果使用样本平均类指标(除以相应类别论文的总数),则会得出相反的结论。

      为了更加形象的理解“重尾分布”和“均衡分布”的percentile与样本平均类指标的不同作用,见下图:“重尾分布”的5% percentile 要远大于“均衡分布”的5% percentile,而“重尾分布”的50% percentile (median) 则要小于“均衡分布”的50% percentile (median)。

      所以,基于完全相同的数据,如果你想证明“大团队比小团队更有创造性”,使用样本均值类指标(比如median)就可以;反过来,如果你想证明“小团队比大团队更有创造性”,那么使用 percentile 作为指标就可以了,正如这篇《自然》论文所做的这样。

      统计学论文经常使用这些技巧,同样的数据,使用不同的指标,可以得出完全相反的结论。一些简单的技巧在Darrell Huff的名著《How to Lie with Statistics》中有所描述。

     基于以上分析,我提出以下观点:

     1、开创性取决于个体研究者的智慧,与团队大小无关。这个智慧的个体研究者可以是小团队中的一员,也可以是大团队中的一员。科学创造是由个体研究者的大脑通过思考完成的,这是常识。无论大团队或者小团队的成果,都是由团队中个体成员的大脑通过思考完成的。大团队也能做出颠覆性成果,比如AlphaGo就是由两三个优秀大脑加几十个人的协助完成的。行行出状元,只要你在你的研究方向上做出世界一流的成果,不管你身处小团队或者大团队都是一样的,你都是优秀的科学家,都会找到属于你的一席之地。

     2、取得开创性成果,最核心的要素是个体研究者要静下心来钻研科学问题,无论你是小团队或者大团队中的普通成员,或者是其中的领导。如何能静下心来钻研科学问题?只有热爱!做自己喜爱的事情本身就是对自己最好的回报。如果你被客观环境打倒,或者被其污染而同流合污,只能说明自己对科学研究爱得不深。不能总抱怨客观环境,关键问题在自身。没有爱怎么办?那就过日子呗,柴米油盐。在大团队里更滋润一些,可以当南郭先生。身边南郭先生多了,可以减轻同事压力,让你更加从容的静心思考,做出一流的成果。

     3、加入大团队(垄断利益集团),分点儿钱,然后把自己边缘化,静心钻研科学问题。我参与过一些大项目(信息科学,材料科学)的运作过程,只要你以积极热情的态度加入组织,抓住各种机会给大佬们擦皮鞋,分到钱并不难。拿到钱以后具体做什么,你有很大的自由度,完全可以“挂羊头卖狗肉”,做你自己认为重要的东西(发展新的理论,编写新的算法,开发可以挣钱的产品,等等),没有人会干涉你。结题时数数论文篇数,吹吹牛,实在不行也可以炒炒冷饭,只要态度诚恳,最后都能通过。擦皮鞋比科学创造容易多了;擦擦皮鞋就能拿到钱,然后干自己喜欢的事情,这样的体制安排对于只想安心做学问的人(比如我)来说,是完全可以接受的。

     4、提倡“大科学”总体上利大于弊。科学创造是一项高风险事业,这一点对大团队或者小团队都是一样的。不能由于过去一些“大科学”项目的失败而否认“大科学”的做法,小科学项目失败的概率更高。通过“大科学”可以把更多的钱套出来,提高科技人员的整体待遇(钱总是要分下去的),使那些有爱又有能力的人更有可能继续从事科研工作,留得青山在不怕没柴烧。



http://blog.sciencenet.cn/blog-2999994-1162997.html

上一篇:干货又来了 -- 深度卷积模糊系统快速学习算法Matlab程序,又一台印钞机的机芯
下一篇:“唯论文”不好吗?

18 熊栋梁 华春雷 赵斌 吕健 杨正瓴 徐志刚 陈德旺 雷宏江 陶勇 王从彦 王俊杰 武夷山 韦恒叶 李陶 李心诚 张成岗 强涛 郭新磊

该博文允许注册用户评论 请点击登录 评论 (75 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备14006957 )

GMT+8, 2019-10-16 12:29

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部