bonjourgl的个人博客分享 http://blog.sciencenet.cn/u/bonjourgl

博文

E级超算华山论剑,中国能否站上超算之巅 精选

已有 6319 次阅读 2016-7-17 18:10 |个人分类:科技杂谈|系统分类:观点评述| 高性能计算, E级超算, 超算, 百亿亿次

在微信上阅读此文章,请戳:E级超算华山论剑,中国能否站上超算之巅


寒冬岁尽,华山绝顶,大雪封山。「东邪」黄药师、「西毒」欧阳锋、「南帝」段智兴、「北丐」洪七公、「中神通」王重阳五大顶尖高手在华山顶上“口中谈论,手上比武”,斗了七天七夜,最终王重阳击败四人获胜,夺得《九阴真经》。这便是江湖人口口相传的华山论剑


如今,国际超算界也正在上演一段华山论剑故事。自新科”全球最快超级计算机“神威·太湖之光”亮相之后,国际超算界开始将目光聚集在超算的下一个里程碑——E级超级计算机。比“太湖之光”峰值还要高一个数量级的E级超算,是超算界公认的“下一顶皇冠”。


01

各国的“E级计划

作为一个国家综合国力和科技创新能力的重要标志,E级高性能计算机已成为当前各国竞相角逐的战略制高点。美国、欧洲、日本等国都提出了自己的E级超算研发计划,中国也将百亿亿次超级计算机(技术)的研究写入了国家“十三五”规划中。


美国自“天河二号”于2013年11月正式登顶当时的超算TOP500榜首之后,美国这个头号超算强国已连续3年未曾染指这一宝座。然而,种种迹象表明,美国从未在“最快超算梯队”上掉队。


在给笔者的邮件回复中,全球超算TOP500排行榜发起人、橡树岭国家实验室及田纳西大学教授Jack Dongarra透露,美国能源部DOE)通过国家战略计算计划(NSCI)以及与产业界和学术界的合作,正在推行能进行百亿亿次计算系统的开发。“该系统集成了硬件和软件能力,在一系列代表政府需求的应用中的表现将是目前10千万亿次系统的100倍。”


欧洲、日本欧洲、日本也制定了自己的E级超算研发计划,并将相应计划的完成时间表设定在了2020年。


被誉为“HPC网红”的中科院计算所研究员、中国计算机学会高性能计算专委会秘书长张云泉告诉笔者,欧盟希望在2020年左右实现E级超算,可能将由Bull公司实现这个计划;日本也是在预计2020年实现E级超算计划,可能将由日立或富士通来实现这个计划。


中国:E级超算是“十三五”规划中的重头戏之一,那么实现的时间表也应该是“十三五”收官(2020年)的时间左右。


值得一提的是,在最新公布的国家“十三五”高性能计算专项课题中可以看到,我国公示出了3个分别由中科曙光国防科技大学以及江南计算技术研究所牵头的E级超算的原型系统研制项目,出现了“三足鼎立”的中国超算在E级超算研发上“三头并进”的局面(后文将对此进行解读)


出人意料地,在几个制定了相关计划的国家中,只有美国相对“悲观”,他们预计百亿亿次超级计算机的建成要等到2022年。据分析,美国此举或许并非故弄玄虚,因为随着高性能计算机运算规模的增加,建造它的难度将是几何倍数的提升


02

不轻松的“E级挑战

百亿亿次超级计算机的建造难度并不仅仅在于速度的提升上,更在于对大规模超算设备的功耗要求。张云泉告诉笔者,按照国际公认标准,E级超算的功耗应低于20MW。按照这一功耗目标要求,未来的E级超级计算机的能效比要达到50 GFlops/W


这是一堵难以逾越的高墙。毕竟排在Green500第三位、创造了大规模高性能计算机效能比的最好成绩的“太湖之光”每瓦性能只有6 GFlops,相差一个数量级。


“功耗墙很难逾越,是各国都在面临的难题。” 张云泉说:“现在大家希望采用异构加速或异构综合的方来降低功耗的要求,但由此带来的是编程的困难。因此,可以说研发E级超算实际上面临着编程墙、功耗墙、可靠性墙和存储墙几个‘大墙’的围堵,如何越过这几堵墙,面临很大的挑战。”

Jack Dongarra对建造E级超算的难度也有充分的估计,他告诉笔者,在准备为超算设备升级之时,软件和应用方面的准备工作要做在前面,以确保E级超算这种“新物种”能够第一时间给科学和产业界带来益处。关于建造超算面临的挑战,他给笔者列出一个“没有特定顺序”的“TOP10挑战名单”。现附下,请超算科学家们共商:


1. Creating more energy-efficient circuit,power, and cooling technologies.


2. Increasing the performance and energyefficiency of data movement.


3. Integrating advanced memory technologiesto improve both capacity and bandwidth.


4. Developing scalable system software thatis power- and resilience aware.


5. Inventing new programming environmentsthat express massive parallelism, data locality, and resilience


6. Creating data management software thatcan handle the volume, velocity and diversity of data that is anticipated.


7. Reformulating science problems andredesigning, or reinventing, their solution algorithms for exascale systems.


8.Facilitating mathematical optimizationand uncertainty quantification for exascale discovery, design, and decisionmaking.


9. Ensuring correct scientific computationin face of faults, reproducibility, and algorithm verification challenges.


10. Increasing the productivity ofcomputational scientists with new software engineering tools and environments.


03

激动人心的“E级应用

人们不遗余力地向E级超算发起挑战,正是对其潜在的巨大作用有着热切的预期。对此,Jack Dongarra的描述激动人心:


“每秒执行百亿亿次计算,这可是我们今天所见机器计算速度的数十上百倍,这些未来的计算机将是一个全新的‘物种’。它们的惊人之处不仅在于更快,更在于可以以全新的方式处理大数据。所以E级超算未来将非常有用,比如攻克癌症。”


“为了找到治疗癌症的方法,我们需要找出以前没有见过的模式。在癌症治疗方面,人们面临的挑战不是缺乏相关数据,而是如何“正确打开”这些数据,并找到合理的模式处理它,从而告诉人们到底是什么原因导致癌症或者如何更有效地对抗它。超级计算机是用于分析基因组和相关分子数据集、患者记录、家族史和与癌症相关的其他复杂信息的优良工具。随着超级计算机的发展,我相信我们可以找到答案。”


当然,E级超算能派上用场的还不止这些,用到它的地方五花八门:

模拟人的心脏,

调查各种药物对心脏的影响;

分析海洋,

了解海洋以弄清如何应对气候变化;

创建新材料,

探索如何消除新材料的摩擦力;

维护世界安全,

建模核爆炸以免除实际测试的需要;

模拟宇宙,

以3D仿真的手法探索我们浩瀚的宇宙

……

张云泉也表示E级超算在上述领域的巨大应用潜力,但他同时指出,摸清E级超算未来应用是当务之急,这与建设E级超算同等重要。


“我们需要马上补足对E级应用需求的分析,对E级应用软件的支持和支撑,以及相关生态系统,特别是软件生态系统的建立,特别是要论证清楚我们国家为什么要发展E级超级计算机E级超级计算机在我们国家有什么用处,这样的问题一定要回答清楚,这样我们E级超算的发展才有用处。”

04

中国能否登顶“超算之巅

看到了发展E级超算面临的种种挑战,了解了E级超算潜在的种种应用,特别是考虑到“十三五”对E级超算的目标规划,问题来了:中国能否在E级计算时代登顶“超算之巅”?


前文提及,我国E级超算研发出现了“三头并进”的局面。中科曙光国防科技大学以及江南计算技术研究所各自牵头了国家“十三五”高性能计算专项课题E级超算的原型系统研制项目。这三家单位在超算领域的技术实力已经毋庸赘言,我国出现在全球超算TOP500榜单前十的超算设备均出自这三家之手,形成了中国超算“三足鼎立”的局面。


值得注意的是,这三家单位目前拿到的是“E级超算的原型系统研制项目”,也就是说,是在E级超算项目正式进入日程之前的预研工作。古人云:预则立,不预则废。原型系统的研制正是出于此意。


“原型系统可以验证一些关键的技术设想,对一些关键技术难点进行测试和改进,为最后建造全部的系统扫清障碍,避免出现大的技术错误和难题。”张云泉说,尽管原型系统不可能暴露所有的问题,但类似的预研项目非常必要。


据消息人士透露,中科曙光牵头的E即超算原型系统研制项目将于近期举行的曙光技术创新大会(IDIC2016)上正式启动。


我国在E级超算研制方面采取的是竞争体制,预计两年之后会对3家单位进行评估,最后采取最好的方案来整合成最后国家的E级超算研发体系。到那时,“三家单位将有可能会产生交集或者合作”。


后语

在“太湖之光”以自主芯片和操作系统将HPC的计算速度刷新十亿亿次之后,中国看到了自主研发E级超算的曙光。张云泉认为,“太湖之光”的成功已经为我国向E级超算迈进打下了一个坚实的基础,只要做好人才、资源、经费和材料的储备,冲击E级超算指日可待。






https://blog.sciencenet.cn/blog-834161-991224.html

上一篇:“贫血”“缺钙”拖累中国工业机器人
下一篇:“太湖之光”获吉尼斯纪录认证,瞬间感觉逼格低了
收藏 IP: 211.100.3.*| 热度|

7 汪晓军 黄永义 李红雨 徐令予 yangb919 xlianggg zjzhaokeqin

该博文允许注册用户评论 请点击登录 评论 (6 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-20 01:25

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部