张鹰的博客分享 http://blog.sciencenet.cn/u/yingzhang1 农村小伙的回顾与展望

博文

2.10 大科技工程三:如何做出大而强的项目

已有 41475 次阅读 2020-7-26 14:42 |个人分类:科技1|系统分类:观点评述


一个关于中国科技水平的比较中肯的评价是,我们是科技(工业)大国,但还不是强国。在商业中,需求大的商品本身便是一种优势,规模化的生产更加容易通过分工、与生产线的自动化而降低成本,获得更高的竞争力。“大”相对于“小”已经是一种优势,在科技发展的过程中我们需要保持和扩大这种优势。另一方面,我们需要研究适合推进一些“大项目”,从而完成向“强”这一个方向的转化。

“大”是一个广度量(extensive,从总量的角度进行衡量,比如总人口,国民生产总值;“强”是一个强度量(intensive),从个体的角度进行对比,比如体育比赛中的速度、材料的硬度等等。大与强可以是没有相关性的:聚集100只羊与1只老虎进行武力单挑,数量大并不会给羊群带来获胜的机会,除非老虎吃饱了撑死。大与强可以是正相关的:比如在拳击比赛中,重量级的选手比起轻量级的选手往往具有更高的出拳力度与速度;在举重比赛中,重量级选手具有力量优势。从这样一些的例子,我们可以分类出在科研中,大引发的强的两种情形:随着数量与尺度的线性增强,归结为规模效应;随着数量与尺度的非线性的增强,归结为协同效应(synergy)。

中国科研人员数量的规模优势可以用于扶持一些工程量巨大的开源软件的开发,保持科研软件的独立性。因为哈工大被美国列为“实体清单”,所以科学计算与模拟仿真的软件MATLAB被禁用,对哈工大教师学生的科研造成了负面影响[1]MATLAB的科学计算部分可以用PythonOctave等开源软件取代,但是Simulink的模拟仿真部分没有较好的替代软件。如果没有核心算法的瓶颈制约,中国的巨大的科研人员数量(比如本科与研究生的一些毕业论文项目的时间投入),可以将小国需要数年完成的工程量,在数月内完成,这是规模效应带来的优势。量变或许不一定产生质变,但是在这个工程量巨大的情况下,完成这个量的积累便是成功。

相对于人口只有500-1000万的发达的人口小国而言(新加坡,瑞典等等)人口大国在较为罕见的疾病与癌症等治疗手段的研究中有规模优势。一些罕见疾病的发病概率较低,所以人口小国的病患数量较少,很难获得统计数据,以验证治疗手段或者药物的有效性,而且由于病患数量少,医药的研发成本高,无法均摊到个人,所以最后难以获得医学基金的资助。由于人口基数大,罕见病患总数较多,人口的大国便可以对这些罕见病进行更加系统的研究,开发成功的药物可以销售到其他国家,或者成功的医治手段可以吸引发达国家的病患到中国接受治疗。

医疗或者基因方面的大数据中存在一个难点,在于高维数据的分析,我们的人口数量大的优点也可以一定程度上减轻这个难点的影响。医疗大数据需要采集不同方面的特征(feature),比如体温、血糖含量、单位血液的白细胞数量、以及各种与疾病可能相关的特征。由于数据维度的诅咒(the curse of dimensionality),在高维情况下,想要研究几个独立变化的特征对疾病的影响时,可以研究的的数据点变得非常稀疏,难以获得统计显著的研究结果。而中国人口比新加坡等国家多约两三个数量级,所以中高维度的问题,可以更加顺利地研究。当然超高维度的情况下,整个地球的人口还是嫌少,我们需要更好的对特征进行转化与分析、或者选取更加适合的统计方面的算法。在卷积神经网络(convolutional neural network)等深度学习算法发展离不开大数据集的建立(小数据集上的深度学习模型容易过拟合而产生预测的错误)。医学上采集大数据,是人口小国天然无法完成的任务,而这是我们的优势之一。

在大科学工程的建设中,当建设成本急剧增长的时候,这个大工程的重要性就要重新审视了。什么是好的大型科研项目呢?我们或许可以从著名数学家陶哲轩对佩雷尔曼、张益唐和望月星一工作的比较中获得一些提示[2]2012年,望月星一声称证明了数学界一个非常重要的未解问题:ABC猜想。他的证明长达500多页,堪称数学界的大项目(但是至今仍然没有得到数学界的广泛认可)。陶哲轩给出了如下的评价:“我并不具有可以给出望月星一工作的第一手的专业知识,但是我可以比较一下他的工作和佩雷尔曼与张益唐(的不同),这两人的工作我更加熟悉。一个惊人的不同点在于,佩雷尔曼与张益唐的提供了比较短小的‘概念证明’(proof of principle),但是望月星一并没有。关于这个概念证明,(我是指张益唐与佩雷尔曼的)论文中的方法,可以比较快速地获得已经存在的研究领域中,不平凡的有意思的新结果(或者一个已知的非平凡结果的新证明)。..., 让我觉得非常奇怪的是,世界上存在一个独立完备的理论,而它的唯一的外部应用是用来证明abc猜想,而且这样的证明需要300多页的设定,没有更小的部分的设定可以用来推导出外部的非平凡结果。”这个评论也比较拗口,但是我们用经济学语言可以翻译一下。

一个科学的规律,只能在搭建了耗费300亿元的设备以后才能证明,如果仅仅投入250亿元则无法证明,这非常的奇怪。而且更加奇怪的是,在花费50亿,或者100亿的时候,我们甚至不能获得这个科学规律在其他领域中的新的推论与研究结果。换而言之、这样的研究课题就只是一个300亿元的孤岛而已,并不会对科学的整体产生任何的促进作用。这也似乎给出了另一个反对超级对撞机的原因。我们可以知道、一个好的大科技工程,必须能够产生阶段性的研究性结果,而且能够阶段性地推导出其他交叉学科的新的发现,提供着非线性尺度增加的新研究结果。

中国引领的医疗的大数据的分析可以鼓励跨学科的协作,从而产生协同效应,获取大到强的非线性增长。随着其他疾病被攻克,死于癌症的病患将逐步增多。不同地区医疗病患的诊疗数据,可以有很好的医学用途,比如随机化实验(randomized experiment)来验证治疗手段效果的统计显著性检验。而且还通过不同地区的分布对比获得新的远见。在30多个省市建立的若干个癌症中心,也可以用来从数据对比,统计出不同疾病在不同地域的影响。2017年的一篇科研文章发现,华北居民的寿命比华南居民略短,极大可能是因为北方供热产生的污染造成的[3],这对于我们该采用什么样环境治理的措施是巨大的证据支持。 类似的,我们也可以通过这样的癌症医学中心来寻找环境及其他因素的影响,推进更好的医学研究:比如吃辣或者其他的饮食习惯是否增进肠癌的概率,环境污染会否增加肺癌的概率。有很多不同的用重要意义的医学课题,依赖于物理学者(医学成像)统计学家(数据分析)、环境学者、医生、生命科学学者、软件工程师(计算机系统、数据中心维护)数据等共同研究探讨。其他的交叉的大科学工程项目也不胜枚举:比如脑科学与神经科学领域的研究[4,5]。脑与神经科学的领域需要神经学者、机器学习、语言学家、计算机图形学者、生命科学学者等等的参与,应用广泛,可以推动人工智能的领域,也可以助推阿尔兹海默综合征之类的医学研究。

在推动科技大工程的时候,我们需要着重培养自己的科研人才。杨振宁在反对超级对撞机的文章,列出了的一大原因便是,超级加速器的设计、建成后的运作和分析时的主导不会是中国人[6]。通俗来讲、中国每个人筹资10元,可以筹得140亿,约折合20亿美元,可以从欧洲、南美购买20个最优秀的足球运动员,然后聘请优质的教练,组成的球队或许可以打遍世界无敌手,但是没有人会认为这是中国足球称霸全球。在大科技工程的建设过程中,需要谨记,不仅需要追求技术的创新与突破,还需要培养出自己的优秀科研人才


引用文献

[1] 瞭望智库,观察丨哈工大被美国断供MATLAB软件,找到替代品很难吗,https://www.thepaper.cn/newsDetail_forward_8034725 2020年7月26日最后访问。

[2] ABC猜想还没有被证明,陶哲轩关于星月望一、佩雷尔曼与张益唐的评论。The ABC conjecture has still not been proved, Terence taos comment on the comparison of Shinichi Mochizuki, Perelman, and Yitang Zhang, 2020年7月26日最后访问。

[3]艾唯拉翰·爱本斯坦等,空气污染的持续暴露对于预期寿命的影响的新证据,来自中国的淮河政策,美国国家科学院院刊,114卷,10384页,2017年。 Ebenstein, Avraham, et al. "New evidence on the impact of sustained exposure to air pollution on life expectancy from China’s Huai River Policy." Proceedings of the National Academy of Sciences 114, (2017): 10384-10389.

[4] 艾瑟·兰德胡一斯,神经科学:大脑,大数据,自然,541卷,2017年,559页。Landhuis, Esther. "Neuroscience: Big brain, big data." Nature,vol 541 (2017):p559.

[5] 亚维斯·弗雷纳克,大数据与神经科学的工业化:理解大脑的一个安全的路线图?科学,358卷,2017年,470页。Frégnac, Yves. "Big data and the industrialization of neuroscience: A safe roadmap for understanding the brain?." Science vol 358, (2017): p. 470.

[6]知识分子微信公众号,杨振宁:中国今天不宜建造超大对撞机,这是个无底洞,2016年9月4日,澎湃新闻https://www.thepaper.cn/newsDetail_forward_15238972020726日最后访问




https://blog.sciencenet.cn/blog-3116575-1243676.html

上一篇:2.9 促进科技行业竞争力的直接与间接补贴
下一篇:2.11 医学与生命科学的发展一:人口老龄化的挑战与机遇
收藏 IP: 68.42.77.*| 热度|

14 王安良 杨清 尤明庆 宁利中 朱晓刚 苏保霞 黄河宁 雷博宇 杜占池 张淑扬 李毅伟 吴志民 楚振宇 李宏翰

该博文允许注册用户评论 请点击登录 评论 (6 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-24 11:59

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部