|||
超级计算机的一条出路(150615)
闵应骅
我在多篇博文中提到超级计算机现在面临的一系列极具挑战性的问题。反正,超级计算机按现在的路子走下去肯定是不行的。全世界都在探索下一步怎么走。IEEE Spectrum 2015/6发表一条新闻,说日本人提出了一个思路,可以看作是出路之一,可供参考。
超级计算机的计算速度在1993年约100每秒10亿次浮点运算(1011),50年后的今天已经达到1015,正在向2020年的1018每秒浮点运算方向前进,要比现在提高1000倍。这就要求研究机构和政府投资数以亿计的经费,而且在技术上也很难实现。
设在东京的日本国立情报学研究所Michihiro Koibuchi说:过去10年我们已经得到了1000倍的改进,但5年后这种机器不可能再用了。他和他的团队有新想法让用户得到新的机器:用激光通过空气连接超级计算机的节点。我们知道,超级计算机的运算速度不单是取决于众多处理器自身的运算速度,也取决于互连网络的数据传送速度,而且这是更有前途的改进途径。
一般地,组成超级计算机的几千上万的处理器由于基本用途的不同而聚集成若干个网络。其拓扑结构用电缆连接的交换机,链接选定的服务器机柜。由于许多用户同时运行不同的任务,各程序之间的通信对特定的任务需要最合适的拓扑,这对同时运行不同的应用就成为一个问题。Koibuchi说:当任务结束的时刻不同,其他任务又加入,使得对拓扑的映射就破坏了。有的处理器很忙,有的处理器却闲着,使得某些任务完成得就很没效率。譬如,当数据在交换机之间跳来跳去,或者一个有序的并行应用被割裂成不规则应用的随机拓扑。
Koibuchi和他的同事们相信自由空间光通信可以缓解这一缺陷,改进性能和资源的利用。自由空间光通信(FSO)用激光在空气中把数据从一个终端传送到它的瞄准线上的另一个终端。由于它宽广的GB级的带宽,它既然可以用于户外,建筑物之间和航空航天和卫星通信,为超级计算机建造室内每秒40GB传输率应该不是问题。
Koibuchi说:我们不是沿着原来的路子走下去,而是用装在机柜里的FSO终端去提供任何两个机柜之间的光线的通信。网络拓扑就可以动态重构,使应用能较好的保持其拓扑,减少破碎和潜伏期,同时也减少电缆的数量。比利时根特大学的并行计算专家D’Hollander认为:FSO适合任意的拓扑,有潜力取代超级计算机机柜之间固定的数据通信骨干网连接。
但是,这种FSO终端现在并没有做出来。Koibuchi他们做了一些软件模拟,发现潜伏期可以减少9%,光纤电缆长度可以减少36%。这是非常有意义的,因为超级计算机有几千公里长的电缆,当此超级计算机过时了以后,这些电缆就被抛弃了。为了在物理上确认这些结果,研究人员建造了4个小样机,用现有元件搭建的双向FSO终端,包括10和40GB/s的光收发模块、商品红外线激光器和用于指挥方向的瞄准仪镜头,还有马达去对准终端的方向,误差在40米以内为0.003度,测试表明模拟结果,数据传输率达到38GB/s。虽然测试成功,Koibuchi认为这个技术的商业化有待时日,严峻的困难摆在面前。至今没有批量的高带宽FSO终端产品。D’Hollander也看到FSO经济是个问题。他说:我对利用精确控制和跟踪设备的FSO终端的成本效率也不乐观。也许,无需操纵机制的FSO终端比较可行。Koibuchi正在和NEC绿色平台研究实验室研究高带宽的FSO终端。
我倒不是说这个方案如何如何有希望,我也不懂,而且也许还有更多更好的方案,只是想说明这样的技术难题需要多学科的协同与合作。譬如激光通信属于高性能计算机系统结构的人知识范围以外的事,他们可能不懂激光通信。又譬如集成电路的进步需要材料科学和半导体生产工艺方面的专家介入。我们现在的科研课题大都下到某一个专业团队,也许搞激光的人不会去考虑超级计算机的问题。怎么让大型的科技问题能有各方面的人自由介入,给大家提供原始性创新的机会,可能是科技管理方面的一个问题,值得研究。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-24 14:32
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社