||
——基于数学学科1997-2020年国家三大科技奖获奖者的分析
摘要:算力是数字经济的核心生产力,东数西算工程致力于提升国家整体算力水平。算法主要由顶尖的科学家和科研团队推动其不断优化进步,其分布影响算力的承载能力。国家三大科技奖获奖成果代表中国相关领域最高科技水平,本文以政产学研为合作网络分析主体,以省域即中观层面为空间分析单位,从研发队伍结构、研发力量与算力枢纽所在省份空间重合度等两个维度,对1997-2020年间数学领域国家三大科技奖获奖者情况做统计分析与描述,发现算力枢纽的算法支撑资源分布严重不均。据此提出,加大政策扶持,加快数字产业化步伐;做好统筹布局,建立分级分类机制;加快算力网络体系关键核心技术突破等政策建议。
关键词:东数西算;算力枢纽;算法
中图分类号:F49 文献标志码:A
1 研究背景
2021年中国数字经济总量达45.5万亿元,同比增长67.3%,在GDP中占比达39.8%[1]。数据中心产业规模近2000亿元[2],数字经济已成为重要的新经济增长点。国家国民经济和社会发展第十四个五年(2021-2025年)规划和2035年远景目标纲要已将打造数字经济新优势,作为支撑经济高质量发展,构建国内国际双循环新格局的关键举措。算据(数据)、算力、算法是数字经济的基础性生产要素,其配置与使用效率对数字经济发展具有举足轻重的影响。数据是信息的载体,算力作为基础设施建设,通过数据中心这一载体承载信息系统的运行,算法是计算的方法和规则,致力于用最少的资源实现最好的性能,主要由顶尖的科学家和科研团队推动其不断优化进步 [3]。
截至2021年底,我国在用数据中心机架总规模超过520万标准机架,平均上架率超过55%,近五年算力年均增速超过30%,算力总规模超过140 EFlops,排名全球第二,与国际先进水平差距相对较小。然而,当下我国数字基础设施建设东中西部地区差异悬殊。为构建国家算力网络体系,2022年2月17日,国家发展改革委等部门联合下发文件,启动实施“东数西算”工程。
算法的分布影响算力的承载能力,即使配备了完备的算力基础设施,也需要搭配算法,才能实时获取庞杂数据背后的信息。东数西算战略背景下,西部数据中心占比已达20%,但因跨区域算力需求并未充分调动,西部地区机柜利用不充分,且数据中心建设供给走在需求前,当下我国数据中心的上架率仅55%左右,且算力的使用也仍有诸多限制因素。
算法是计算机科学中最重要的基石,严密的数学推导是其基础,故而数学领域核心研发力量是重要的算法支撑资源。东数西算是国家级重要战略工程,对于经济社会发展会产生深刻影响,因此本文主要关注国家级算力枢纽所在省份,算力供给与算法支撑能力的匹配程度。国务院设立的国家自然科学奖、技术发明奖和科学技术进步奖,代表了我国在科技创新活动中的最高研发力量。本文以政产学研为合作网络分析主体,以省域即中观层面为分析单位,从研发队伍结构、研发力量与算力枢纽所在省份空间重合度等两个维度,对1997—2020 年间数学领域国家三大科技奖获奖者情况做统计分析与描述,通过基尼系数比较其资源分布是否均衡,以期对提升东数西算效能的可能路径展开探讨。
新经济地理学认为,信息通信技术将世界各地链接起来[4],将深刻改变区域经济发展格局。早在20世纪末,Capello[5]和Stratigea[6]等学者就开始探索探究信息通信与区域集聚之间的关系。Husson[7]则从实证角度论证信息通信技术能够影响区域格局。数字经济是信息技术革命产业化和市场化的产物[8],可突破空间限制[9],其出现正在加速变革传统经济模式 [10],是推动区域经济发展的新动力[9]15。
与此同时,部分学者针对算力展开了一系列研究。算力网络是数字经济时代推动经济高质量发展的核心动能[11]。郭亮等[12]对我国算力及算力能效的研究现状进行了综述,为数据中心算力提供了一种行之有效的衡量方法。李洁等[13]则是描述总结了数据中心行业发展现状。李平等[14]立足全球算力竞争现状,针对性提出中国方法。
算法是知识生产的基本方法,更高水平的算力依赖于更加精致的算法。当下关于算法的相关研究主要集中在技术领域和法律规制,对算法人才分布的研究却是凤毛麟角。当前我国数字基础设施建设布局和算法领域人才分布极不均衡,东中西部地区数字化水平参差不齐。对此,韩剑和郑秋玲[15]指出,资源错配是客观存在的,要素配置一旦出现市场失灵现象,将使得生产效率低下,导致经济亏损。洪银兴[16]认为要素自由流动是市场在资源配置中决定作用的外现,可极大提高资源配置效率,从而改善资源错配[17]。促进要素合理流动,矫正要素资源失衡错配也是构建国内大循环的重要举措 [18]。实现资源从低效率部门或企业,向高效率部门或企业流动是全要素生产率提高和经济增长的关键 [19]。
既有对东数西算的研究更多强调其战略意义。王建冬等[20]从战略、产业和技术三个视角探讨东数西算构想。王春晖[21]对就我国实施东数西算工程的战略布局作简要分析,构建东数西算网络创新体系有利于推动数字经济发展,加快构建一体化国家算力体系[22]。吕天文[23]则是论述了双碳目标下,东数西算工程的节能新路径。此外,东数西算工程也有利于全国算力的科学配置和安全备份[9]11。东数西算所面临的挑战也是学界关注的重点。当下西部地区人才技术资金基础薄弱、短期市场发展不成熟[24],东数西算有可能会进一步加大数字鸿沟,出现算力孤岛和数据产业飞地,且现行体制下,发挥西部地区电价优势也有诸多限制[9]13。
综上所述,既有研究缺乏对算法支撑能力即数学领域核心研发力量,以及算力供给与其算法支撑能力匹配程度的探讨,厘清以上问题是提升我国东数西算效能的关键。数学领域三项国家级科技奖励作为对我国科研的国家级重要奖励,具有权威性,可较为真实地反映数学领域核心研发力量主体间的合作和分布状况。以这些奖项信息为基础数据,结合算力规模计算基尼系数,比较数学领域核心研发力量和东数西算枢纽分布情况,可分析东数西算枢纽节点的算法支撑能力,窥见东数西算工程中算力的供给与其算法支撑能力的匹配程度,为以上问题探讨提供新的视角。
3.1 技术路线
研发,是以企业、高校以及政府科研机构等为主体所进行的各类研究与发展活动的统称[25]。利用社会网络分析探究国家三大科技奖获奖主体合作结构和区域分布情况,比较获奖主体所在省份和东数西算工程算力枢纽所在省份的分布情况,计算其基尼系数,分析算法支撑资源的供需匹配程度。
政策通常以十年为周期,我国规划以五年为跨度;整理中央人民政府及部委官网 1996-2020 年间科技政策,发现2004年和2013年为政策数量“波谷”(如图1);1995年《国家科学技术奖励评审委员会章程》、2006年《国家中长期科学和技术发展规划纲要》和2012年《关于深化科技体制改革 加快国家创新体系建设的意见》的出台为我国科技发展进程中标志性节点;薛澜、范柏乃等学者在相关研究中将2005年和2013年作为我国科技创新政策发展的阶段节点[26],结合政策周期、规划跨度并考虑政策数量、重大节点与已有文献,以8年为周期将研究时期平均划分为1997-2004年(Ⅰ)、2005-2012年(Ⅱ)和2013-2020年(Ⅲ)三个阶段。
图1 1997-2020年间科技政策数量及年度趋势(略)
(1)采用社会网络分析法对1997-2020年间国家三大科技奖励获奖数据展开研究,以网络节点数和网络连线数为基础,测度网络密度和聚类系数,分析不同阶段三大科技奖励获奖合作网络的整体特征,探究我国数学领域科技创新核心研发力量 “怎样变化?”。通过对合作网络进行中心性分析,发掘合作网络的核心节点,可分析合作网络的结构特征,探究我国数学领域科技创新的核心力量“由谁构成?”。为保证测度的精确性,所有完成单位统一以二级单位为测度主体。
网络密度(D)反映了节点之间联系的密切程度。网络密度越大,代表网络中各节点之间的联系越紧密,合作越频繁。公式如下:
略 (1)
其中,l为合作网络中三大奖获奖主体节点的合作数,n为获奖主体数。
聚类系数(略)反映节点之间的成团程度,聚类系数数值越大,代表成团程度越大,获奖主体间的合作越密切。公式如下:
略 (2)
其中,Ei为获奖主体i的ki 个合作主体间存在的合作数。
(2)基尼系数(G)是不平等面积与完全不平等面积之比,可用来判断其均衡程度,是展现差异程度的一种指标[27],可用于分析生产力布局和产业结构[28],是一个介于0和1之间的比例数值。联合国规定:基尼系数大于0.5,表示差距悬殊;介于0.4-0.5,表示差距较大;介于0.3-0.4,表示相对合理;低于0.2,表示绝对平均。公式如下:
略 (3)
3.2 数据来源及选取
通过检索国家科技奖励办公室官网,整理其印发的《国家科技奖励获奖项目目录》,汇总国家科技奖励项目资料,参照《学科分类与代码》(GBT13745-2009),对1997-2020年间国家自然科学奖、技术发明奖、国家科技进步奖获奖项目进行一级学科归类,将国家科技奖励评审范围内的数学、信息科学与系统科学和计算机科学技术等9个一级学科(如表1)划入数学领域,最后判定得到数学领域获奖项目307项,其中国家自然科学奖项目85项,国家技术发明奖27项,国家科技进步奖195项。
项目基础数据包括项目序号、项目编号、项目名称、主要完成单位和主要完成人,为减小统计误差,对有多个合作单位的奖项取前3个作为代表单位。首先,为避免数据处理混淆,以项目获奖年份、奖项类别和项目序号为依据,对各项获奖项目进行唯一编码。其次,通过Python网络爬虫技术爬取完成单位所在地区,完善地区信息。最后,整合构建具有唯一编码、项目获奖年份、奖项类别、所属一级学科、完成单位和地区信息的数据库。
此外,为保证数据权威性和完整性,依托由工业和信息化部信息通信发展司主编的《全国数据中心应用发展指引2020》和《中国综合算力指数》,选择2020年全国各省份测算数据中心可用机架数这一截面数据,分析2020年全国数据中心的建设发展状况。
通过Gephi进行可视化(如图2),使用UCinet测度网络密度和聚类系数值(如表3),描述合作网络的特征与变化。从测度结果看,1997-2020年间三个阶段节点数和连线数逐渐减少,聚类系数先轻微上升,再呈下降趋势,说明主体间合作有所分散,主体数量锐减。整体合作网络密度呈现增大趋势,说明数学领域核心研发力量间合作日益密切,合作对中心节点的依赖在逐渐增强。部分高等院校和科研院所通过专业学术会议和合作科研项目等方式联系日益密切,形成凝聚子群。第一阶段合作网络核心节点为清华大学、哈尔滨工业大学、北京航空航天大学、中国科学院自动化研究所和中国科学院软件研究所等;第二阶段核心节点为浙江大学、西安交通大学、中国科学院计算技术研究所、清华大学和哈尔滨工业大学等;第三阶段核心节点为清华大学、北京航空航天大学、中国科学院计算技术研究所和浙江大学等,由此可得,1997-2020年间三个阶段的核心节点重合度较高。
1997—2020年间三类奖项网络密度变化各不相同,自然科学奖持续下降,技术发明奖先下降再轻微上升,科技进步奖呈不断上升趋势,前两个阶段同时期内技术发明奖研究密切程度最高,自然科学奖次之,科技进步奖最低;第三阶段科技进步奖研究最为密切,自然科学奖网络密度居最末,说明数学领域试验发展的合作日益密切。
测度结果显示,1997—2020年间整体合作网络的聚类系数先轻微上升再呈下降趋势,自然科学奖和技术发明奖均先降后升,成团程度总得来说仍有所下降,科技进步奖前两个阶段持平,第三阶段小幅下降。这表明1997年以来,数学领域的整体合作先变稀少,再开始聚集,综合来看,数学领域核心研发主体分布有所分散。
表2 科技创新合作网络节点与连线数 | ||||
阶段 | 总 体 | 自然科学奖 | 技术发明奖 | 科技进步奖 |
网络节点数 | ||||
Ⅰ | 148 | 15 | 9 | 138 |
Ⅱ | 139 | 18 | 17 | 123 |
Ⅲ | 70 | 37 | 20 | 23 |
网络连线数 | ||||
Ⅰ | 124 | 5 | 6 | 113 |
Ⅱ | 145 | 6 | 11 | 129 |
Ⅲ | 65 | 24 | 16 | 25 |
表3 科技创新合作网络整体性指标测度 | ||||
阶段 | 总 体 | 自然科学奖 | 技术发明奖 | 科技进步奖 |
网络密度 | ||||
Ⅰ | 0.005 8 | 0.023 8 | 0.083 3 | 0.006 1 |
Ⅱ | 0.007 8 | 0.019 6 | 0.040 4 | 0.008 8 |
Ⅲ | 0.013 5 | 0.018 0 | 0.042 1 | 0.049 4 |
聚类系数 | ||||
Ⅰ | 0.443 | 0.500 | 0.500 | 0.452 |
Ⅱ | 0.447 | 0.278 | 0.333 | 0.452 |
Ⅲ | 0.417 | 0.405 | 0.472 | 0.447 |
4.2 核心研发力量合作主体结构性分析
政产学研是核心研发力量的重要主体,将国家科技奖励获奖单位分为高等学校、科研院所和企业等三类。统计1997-2020年间各类主体获奖占比(见图3)发现,在我国研发创新的不同方面,主体参与结构存在明显差异。自然科学奖主要由高等院校获得,其次是科研院所,企事业单位未曾获奖,相互之间差异悬殊;技术发明奖主要由高等院校和企事业获得,科研院所次之;科技进步奖主要由高等院校和企事业单位获得,科研院所虽居最末,但仍高于自然科学奖和技术发明奖的各类主体数量。表明在数学领域中,高等院校始终是核心主体,基础研究方面科研院所影响力远大于企事业单位,应用研究和试验发展方面企事业单位影响力均高于科研院所。
图3 1997—2020年国家科技奖励获奖主体数量(略)
比较1997-2020年间自然科学奖、技术发明奖和科技进步奖的获奖主体所在省域合作网络,发现北京、浙江、上海、辽宁、江苏和山东等属于核心节点,在数学领域核心研发力量中占重要地位,如图4所示。北京属于最核心的节点,与上海、广东、江苏、黑龙江、浙江、湖南、辽宁、山东等18个省份均有合作,其中北京与上海、广东的合作最密切。上海与江苏、浙江的合作也较密切,江苏省内和北京市内合作也较多。此外,数学领域核心研发力量合作网络中,省域合作较好的节点均分布在东部地区,海南、贵州、台湾、内蒙古、西藏、宁夏和澳门等7个省级行政区无获奖主体分布。
图4 1997-2020年间三大奖获奖主体的省域合作网络(略)
使用UCinet计算中心度指标,得出网络核心节点(如表4),结合主体数量和奖项学科分布,具体分析数学领域各阶段的主体合作结构。
以单位类型分类发现,核心节点的单位类型主要为科研院所和高等学校,企业核心节点较少,高等院校在各阶段各环节始终处于核心位置。在我国数学领域的科技创新合作网络中,科研院所和高等院校在研发合作网络中处于优势地位,参与数量与核心节点均较多。企业单位在试验发展中的参与数量较多,但在各阶段各环节中均未出现核心节点,可以看出企业在数学学科研发创新中的主导能力较弱,仍需进一步发掘自身优势,以推动“自下而上”的研发创新路径发挥更大作用。
以学科类型分类发现,顶尖学府如清华大学、北京大学等在三大奖获奖主体中均存在部分核心节点,军工类专业院校如哈尔滨工业大学、西北工业大学等在技术发明奖以及科技进步奖中存在较多核心节点。从获奖项目学科类别来看,信息科学与系统科学和计算机科学技术专业高等学校活跃于自然科学奖和科技进步奖,但在技术发明奖,即应用研究方面相对较弱。此外,以数学学科为优势学科的高等院校如北京大学、复旦大学、山东大学和清华大学等具有研究基础优势,结合国家科技奖励学科数量分布,不难看出,数学学科自身较强的高等院校和军工类高校及科研院所,是数学领域研发创新中的核心力量。由此可知,我国算法的高端技术支撑能力受市场影响不大,主要受政策引导和产学研合作影响,研发产业化水平较低。
表4 数学领域研发合作网络核心节点 | |||||||
自然科学奖 | 技术发明奖 | 科技进步奖 | |||||
高等院校 | 科研院所 | 高等院校 | 企事业单位 | 高等院校 | 科研院所 | 企事业单位 | |
阶段Ⅰ | 南京大学 | 中国科学院半导体研究所、中国科学院理论物理研究所 | 南开大学、北京大学医学部 | 首都医科大学附属北京同仁医院 | 中国地震局、国家气象中心 | ||
阶段Ⅱ | 香港中文大学、西安交通大学、清华大学、浙江大学 | 中国科学院数学与系统科学研究院、中国科学院自动化研究所 | 清华大学、哈尔滨工业大学、浙江大学 | 上海交通大学、哈尔滨工业大学、西安交通大学、复旦大学、中南大学、北京航空航天大学、北京大学、吉林大学、南京大学 | 中国科学院软件研究所、中国科学院计算技术研究所、中国气象科学研究院、中国科学院研究院 | 北大方正集团有限公司 | |
阶段Ⅲ | 北京大学、清华大学、中国人民解放军火箭军工程大学、中山大学、山东大学 | 中国科学院数学与系统科学研究院、中国科学院计算技术研究所 | 上海交通大学、西北工业大学、北京邮电大学 | 清华大学、北京航空航天大学、 | 中国科学院自动化研究所 |
“东数西算”工程在全国布局的8个国家算力枢纽节点,是我国算力网络的骨干连接点。东部地区节点为粤港澳大湾区、成渝地区、长三角地区和京津冀地区算力枢纽,均分布在一线城市周边地区,缓解一线城市资源供给紧张问题,实现数据中心的协调可持续发展,侧重于发展数据产业。西部地区节点为贵州、内蒙古、甘肃、宁夏算力枢纽,均分布在能源丰富的西部地区,从而减少算力的单位成本,开发绿色能源,主要是发展算力基础设施。通过国家枢纽节点布局,缓解我国东部地区因城市资源紧张而难以实现数据中心高质量发展、西部地区资源丰富但算力基础设施不健全且算力需求较低等不平衡状况,一方面是将时效性需求不高的业务转移到西部,实时算力向一线城市周边扩散,另一方面是在“双碳”目标下实现数据中心的绿色、低碳发展,提高绿色能源利用率,优化数据中心能源使用效率。此外,数据中心是数据基础设施的核心载体,将其向西部地区转移,不仅有利于提升数字产业链抗风险能力,还有利于保障国家安全。
自发布《关于数据中心建设布局的指导意见》和《全国数据中心应用发展指引》以来,我国的数据中心分布不平衡程度日益下降,新建大型、超大型数据中心逐渐向一线城市周边地区和能源丰富的西部地区转移,数据中心不再过度集中于一线城市。截至2019年年底,北京市、上海市、广东省这3个数据中心热点地区的在用机架数的全国占比降低到29%,中部和西部地区数据中心在用机架数的全国占比约为34%。2020年各算力枢纽所在省份测算数据中心可用机架数如图5所示。
图5 算力枢纽所在省份2020年测算可用机架数(略)
如图5所示,东部地区四大枢纽所在省份可用机架数远高于西部地区,其总和为西部地区枢纽所在省份可用机架数总和的5倍。《中国算力指数》显示,上海、广东、北京等在算力方面名列前茅,江苏毗邻上海、河北邻近北京,因受虹吸效应的积极影响,积极承接其资源外溢需求,算力的在用和在建规模也居全国前列。内蒙古、贵州等因其绿色能源丰富、土地成本较低等因素,算力规模也相对可观。随着东数西算工程的推进,各大算力枢纽将加快建设超大型、大型数据中心,西部地区为承接来自东部地区的对时效性要求较低的数据,大力建设算力基础设施,算力规模差异将进一步缩小。数字经济底层是数据,中间是算力,顶层是算法,仅靠建设和优化算力基础设施是远远不够的,算法也是重要的战略资源。
算法依托人才,而国家三大科技奖励代表了我国核心研发力量,籍此,通过比较1997-2020年间算力枢纽所在省份三大奖累计获奖次数分布,探讨各大算力枢纽的算法支撑情况,如图6所示。我国数学领域在东数西算各枢纽的算力支撑能力不尽相同,有以京津冀枢纽、长三角枢纽和粤港澳大湾区枢纽为代表的支撑能力较强的地区,也存在以宁夏枢纽和贵州枢纽为代表的支撑能力的持续性缺失的枢纽。东部地区四大枢纽所在省份获得国家科技奖励主体数量远高于西部地区,其中京津冀枢纽对算力的支撑能力最强,长三角枢纽所在省份次之,二者所在省份获奖数量均超100。西部地区四大枢纽中内蒙古枢纽和甘肃枢纽所在省份情况相对较好,但仍远不及东部地区四大枢纽所在省份中情况最差的重庆。宁夏枢纽和贵州枢纽研发支撑能力较差,所在省份获奖主体分布数量为0。
图6 1997—2020年国家算力枢纽所在省份三大奖分布图(略)
洛仑兹曲线越弯曲,基尼系数越大,资源分布越不均衡,反之亦然[29],洛仑兹曲线如图7所示。因人才是累积资源,因此笔者将1997-2020年间数学领域国家三大奖获奖次数作为2020年的算法支撑资源,计算得出算力枢纽所在省份国家三大科技奖励和可用机架数量基尼系数为0.303,体现了我国算力枢纽算法支撑资源分布相对合理。但随着东数西算工程的不断推进,算力规模尤其是中西部地区算力规模将迅猛上涨,然算法支撑资源却非一朝一夕可有巨变,因此,算力枢纽间每万架标准机架规模所配备的核心研发力量,差距会日渐悬殊。
图7 算力枢纽所在省份洛伦兹曲线(略)
比较各算力枢纽所在省份1997-2020年间累计获奖次数和2020年可用机架数,北京、安徽、天津、上海的算法资源配备情况较为良好,密度比均大于1,如图8所示。整体而言,东部地区算法资源配备情况远优于西部地区,京津冀枢纽密度远高于其他各枢纽,长三角枢纽、粤港澳大湾区枢纽、甘肃枢纽和成渝枢纽次之,贵州枢纽和宁夏枢纽密度最低,为0。其中甘肃和河北情况有些许特殊,甘肃密度比远高于河北,原因在于甘肃算法分布情况虽相较于河北仅稍好一些,但河北算力资源丰富,远优于甘肃地区。受东数西算政策引导,国家将加快数据中心向西大规模布局,但贵州、宁夏、内蒙古算法资源较为匮乏,其中甘肃枢纽虽每万架标准机架规模所配备的算法支撑资源优于成渝枢纽,但其算法资源并不丰富,仅因算力规模相对较小。贵州枢纽因其丰富的能源及低廉的电价等因素,算力规模远高于甘肃枢纽和宁夏枢纽,但贵州、宁夏、内蒙古这三大枢纽基本不存在数学领域的最高研发力量,所在省份1997-2020年间数学领域三大科技奖励获奖次数合计为2。一方面,给西部地区承接东部地区算力带来一定挑战,另一方面,核心数字人才稀缺,将导致数字鸿沟将愈发扩大,区域差距进一步拉大。
图略
图8 算力枢纽所在省份2020年核心研发力量与机架规模比值分布图
综上所述,东数西算工程在实际推动过程中,需注意东西部数据发展不平衡的现象,针对西部地区人才技术资金基础薄弱等特点,西部地区四大算力枢纽应注重人才培养和吸引、数据应用多元化等,加快数字产业化步伐。
区域发展长期处于不平衡状态,将降低经济生产效率,激化社会矛盾[30],一方面会滋生地方保护主义,各经济主体决策均从自身利益出发;另一方面,落后地区为追求经济发展,造成产业同质化严重,导致无序竞争,这将严重影响我国经济的总体稳定性和健康发展。当前我国东西部地区数据中心算力算法供需结构严重失衡,区域发展差异悬殊。
区域经济发展梯度转移理论认为一个国家的经济发展客观上存在梯度差异,高收入地区属于高梯度,低收入地区为低梯度,由于虹吸效应,高梯度地区集聚大量生产要素,产业结构逐渐高端化,同时资源外溢辐射周边地区;中、低梯度地区通过承接高梯度地区迁移的中低端产业,促进当地经济增长。京津冀枢纽、长三角枢纽和粤港澳大湾区枢纽为高梯度地区,其算力规模和算法支撑资源都较为丰富,区域内无论是机架规模、数据中心上架率,还是数学领域国家核心研发力量的分布及合作,都远高于其他枢纽。算力、存力、运力、算法均处于全国领先位置,因此要进一步发挥技术和经济上的优势,加大政策引导,将时效需求低的业务转移到西部地区,有一定时效要求的算力逐步向周边辐射,在一线城市发展超算、智算数据中心,周边地区建设城市数据中心和边缘数据中心,推动数据中心集约低碳发展。
成渝枢纽为中梯度区域,虽算力规模和算法领域人才数量不及东部地区其他三个枢纽,但成渝枢纽仍是属于用户规模相对较大、实时算力需求较旺盛的枢纽节点。其所在省份2020年数学领域核心研发力量与可用机架规模比值,虽高于粤港澳大湾区枢纽所在省份,但是仅仅因其数学领域三大奖获奖次数和可用机架规模体量均远小于粤港澳大湾区枢纽。虽然成渝枢纽不用承接一线城市的实时性算力需求,更多是东数西算工程承上启下的桥梁,但城市若要发展高要求的实时性算力,承接长三角枢纽的外溢资源,并辐射周边城市,需提升算法支撑资源,依托电子科技大学等高校,加强与北京、上海、江苏、浙江、辽宁和河南等地的研发合作。
甘肃枢纽、内蒙古枢纽、贵州枢纽和宁夏枢纽为低梯度区域,该组别所在省份每万架标准机架规模所配备的算法支撑资源严重缺乏。内蒙古和贵州算力枢纽虽在算力、存力方面逐渐居优势地位,但运力方面西部地区整体发展较差,运力情况较好的省份则全集中在东部。一方面,甘肃枢纽、贵州枢纽和宁夏枢纽仅需提供非实时算力保障,而内蒙古枢纽在东数西算工程中的定位除提供非实时算力保障外,还要需承接京津冀枢纽部分实时性算力需求,因此内蒙古枢纽不仅受存力影响较大,对算力、运力和算法也提出一定要求。但内蒙古的算法资源却极为稀缺,难以较好利用京津冀地区的扩散效应,因此可加强与北京、辽宁、黑龙江等周边邻近省份的研发合作。相较于西部地区其他枢纽所在省份,甘肃枢纽的算法资源有一定基础,可在加强与陕西、浙江、辽宁等省份研发的基础上,有所侧重的着力发展算力基础设施建设,从而为更好承接一线城市算力需求创造条件。另一方面,贵州枢纽和宁夏枢纽算法资源极度匮乏,当下应更多着眼于加大算力基础建设,发展存力,积极承担东部地区算力枢纽的数据存储业务。
虽然整体来看,短期内西部地区主要承接东部地区低端算力产业,提高了西部绿色资源的利用率,促进形成西部大开发新格局,但不能仅止步于此。要抓住东数西算产业转移的契机,大力建设基础设施,积累资金和发展经验,培训和吸引人才,并在此基础上大力发展教育,吸引发达地区资本、人才的流入,逐步发展为实时算力中心。
作为实时算力中心之一的粤港澳大湾区算力枢纽,致力于成为全国一体化大数据中心协同创新样板标杆。身为全国数字经济的领头羊,发展粤港澳地区的算力优势,需着眼于计算效率的提高和基础设施的完备,统筹规划大数据中心区域布局。在广州、深圳、珠海、东莞等有基础的城市建设高性能计算中心及国际离岸数据中;以韶关为承载地建设大规模绿色核心数据中心集群;以其他非核心集群城市为承载地布局城市数据中心和边缘数据中心。韶关数据中心集群建设要发挥其自身优势,要利用好其地处华南地区中心的区位优势,加大人才培养和吸引,契合新能源汽车、生物医疗等粤港澳大湾区的战略性产业,从而成为广东高质量发展产业链的重要一环。
数据、算力和算法均是数字经济核心要素,数据利用算力基础设施,通过算法尽可能以小的成本呈现数据中蕴藏的信息,协调好三者之间的关系,对高质量发展数字经济至关重要。针对当下我国算力、算法领域人才分布严重不均的现状,国家发改委等四部门批准同意实施东数西算工程,但除技术难题外,仍面临算力基础设施建设虽已到位,但因缺乏算法领域人才,配套措施不完备,导致当地需求较少,且无力承接东部地区部分温冷业务。籍此,提出以下三点建议。
第一,加大政策扶持,加快数字产业化步伐。一方面, “东数西算”工程在国家统筹布局的基础上,在政策引导的基础上,更好发挥市场力量,实现数据产业的健康发展。另一方面,要不断破除数据跨域流通的体制机制壁垒,发挥市场机制的决定作用,使得数据要素得以自由流动,从而提升数据资源利用效率。此外,政府还需出台相关扶持政策,培养和吸引大批数字化人才。
第二,做好统筹布局,建立分级分类机制。有关部门做大量的预估性调研,做好统筹规划,真正从需求侧出发契合东部算力需求。首先,要制定相应标准规范,明确目标,避免盲目扩张;其次,东部地区算力枢纽着力建设实时性算力中心,优化数字产业发展格局,西部地区算力枢纽大力完善数字基础配套,积极承接非实时性算力需求,产业链着力向大数据上下游产业拓展。
第三,突破核心技术,破解技术融合难题。一方面,要促进信息技术不断更新迭代,解决跨域流通技术难题,打造统一的算力网络,提高算力枢纽所在省份的算力、运力、存力,实现数据要素的自由流动。另一方面,要立足双碳目标,加大对西部算力枢纽所在省份清洁能源的开发利用力度,充分发挥电价低廉优势,提高数据中心清洁能源供电比重,极大降低用电成本。
参考文献
[1]国家互联网信息办公室.数字中国发展报告(2021年)[EB/OL].(2022-08-02)[2022-10-08]. http:// www. cac.gov.cn/2022-08/02/c_1661066515613920.htm.
[2]新华社客户端.东数西算新格局. [EB/OL].(2022-03-01)[2022-10-08]. https://baijiahao.baidu.com /s?id=1726083173854322263&wfr=spider&for=pc.
[3]李平,邓洲,张艳芳.新科技革命和产业变革下全球算力竞争格局及中国对策[J].经济纵横,2021 (04):33-42+2.DOI:10.16528/j.cnki.22-1054/f.202104033.
[4]路紫.信息经济地理论[M].北京:科学出版社,2006: 63.
[5]Capello Roberta,Nijkamp Peter.Telecommunications as a catalyst development strategy[J]. Netcom, 1993,7(1).
[6]Stratigea Anastasia,Giaoutzi Maria.Teleworking and Virtual Organization in the Urban and Regional Context[J]. Netcom,2000,14(3).
[7]Husson J P.Teleconferencing impact onaenan transport[J].Netcom, 1993, 7(01): 165-209.
[8]陈晓红.数字经济时代的技术融合与应用创新趋势分析[J].中南大学学报(社会科学版),2018,24(05):1-8.
[9]张可云,杨丹辉,赵红军,陈晓东,汤正仁.数字经济是推动区域经济发展的新动力[J].区域经济评论,2022(03):8-19.DOI:10.14017/j.cnki.2095-5766.2022.0061.
[10]Goldfarb,A. ,and C. Tucker. Digital Economics[J].Journal of Economic Literature, 2019,57(1):3-43.
[11]吕廷杰,刘峰.数字经济背景下的算力网络研究[J].北京交通大学学报(社会科学版),202 1,20(01): 11-18.DOI:10.16797/j.cnki.11-5224/c.20201231.003.
[12]郭亮,吴美希,王峰,龚敏.数据中心算力评估:现状与机遇[J].信息通信技术与政策, 2021(02):79-8 6.
[13]李洁,郭亮,谢丽娜.数据中心发展综述[J].信息通信技术与政策,2021,47(04):13-18.
[14]李平,邓洲,张艳芳.新科技革命和产业变革下全球算力竞争格局及中国对策[J].经济纵横,2021 (04):33-42+2.DOI:10.16528/j.cnki.22-1054/f.202104033.
[15]韩剑,郑秋玲.政府干预如何导致地区资源错配——基于行业内和行业间错配的分解[J].中国工业经济,2014(11):69-81.DOI:10.19581/j.cnki.ciejournal.2014.11.006.
[16]洪银兴.基于完善要素市场化配置的市场监管[J].江苏行政学院学报,2018(02):47-56.
[17]王星媛,白俊红.要素流动、资源错配与全要素生产率[J].经济问题探索,2021(10):50-61.
[18]叶初升,李承璋,罗连发.资源错配的多层次识别、分解与比较——畅通国民经济循环的分析视角[J].社会科学战线,2022(03):42-55+281.
[19]陈翼然,李贻东,靳来群,张瑞.我国要素配置优化的着力点在哪?——基于多维度要素配置扭曲程度的比较分析[J].管理评论,2022,34(02):62-75.DOI:10.14120/j.cnki.cn 11-5057/f.2022.02.014.
[20]王建冬,于施洋,窦悦.东数西算:我国数据跨域流通的总体框架和实施路径研究[J].电子政务,2020(03):13-21.DOI:10.16582/j.cnki.dzzw.2020.03.002.
[21]王春晖.“东数西算”工程的战略布局[J].中国电信业,2021(08):47-51.
[22]曹方,张鹏,何颖.构建“东数西算”网络创新体系推动数字经济发展[J].科技中国,2 022(03):5-8.
[23]吕天文.“双碳”目标下 “东数西算”节能新路径[J].通信世界,2022(06):26-28.DOI:10.13571/j.cnki. cww.2022.06.013.
[24]杨沛江,刘岩.数据资源“腾笼换鸟”和推动西部“东数西算”产业发展的思考[J].上海信息化,2022(01):14-19.
[25]黄亮. 国际研发城市的特征、网络与形成机制研究[D].华东师范大学,2014.
[26]薛澜.中国科技创新政策40年的回顾与反思[J].科学学研究,2018,36(12):2113-2115+2121.DOI:1 0.16192/j.cnki.1003-2053.2018.12.001.
[27]陈希孺.基尼系数及其估计[J].统计研究,2004(08):58-60.DOI:10.19343/j.cnki.11 -1302/c.2004.08. 014.
[28]王金南,逯元堂,周劲松,李勇,曹东.基于GDP的中国资源环境基尼系数分析[J].中国环境科学,2 006(01):111-115.
[29]侯华丽,吴尚昆,王传君,刘建芬,陈其慎.基于基尼系数的中国重要矿产资源分布不均衡性分析[J].资源科学,2015,37(05):915-920.
[30] Kanbur R,Venables A J. Spatial Inequality and Development [M].Oxford: Oxford University Press,2005.
王福涛; 周盈盈; 袁永; 王芷昀, “东数西算”战略视角下算法支撑资源空间分布探究——基于1997—2020年数学学科国家三大科技奖获奖者的分析, 科技管理研究, 2023, 43(08): 71-81.
“东数西算”战略视角下算法支撑资源空间分布探究——基于1997—2020年数学学科国家三.pdf
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-22 12:19
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社