||
存算一体芯片。其核心思想是将部分或全部的计算移到存储中,计算单元和存储单元集成在同一个芯片,在存储单元内完成运算,让存储单元具有计算能力。这种极度近邻的方式很大程度上降低了数据移动的延迟和功耗,解决了存储墙问题。
阿里达摩院发布的2020年十大科技趋势里,它认为存算一体是突破AI算力瓶颈的关键技术,朝着这个趋势阿里发布了近存储计算芯片。近存储计算与存内计算都是存算一体的实现方式,但是概念不同。
近存储计算指的是计算操作由位于存储芯片外部的独立计算芯片完成。通过采用先进的3D封装方式把内存和计算单元封装在一起,可以达到几千根甚至上万根连线,两者之间的带宽增加,提高了数据搬运速度。近存储计算本质上来说还没有做到真正的存算“一”体。
它从一开始设计计算芯片和存储芯片的时候,就设计好了链接两方的通路,将数据运输距离极致缩短。设计芯片本就相当于用这些晶体管在指甲盖大小的面积上建造一座城市,现在是需要重新设计两座城市,并提前在中间设计好互相链接的通道,这是难点,也是竞争力。阿里发布的,正是采用这个技术的存算一体芯片。
存内计算指的是通过在存储器颗粒上嵌入算法,使得存储芯片内部的存储单元完成计算操作,存储单元和计算单元完全融合,没有独立的计算单元。
在这种方式下,数据不需要单独的运算部件来完成计算,而是在存储单元中完成存储和计算,消除了数据访存延迟和功耗,是一种真正意义上的存储与计算融合。同时,由于计算完全依赖于存储,因此可以开发更细粒度的并行性,获得更高的性能和能效,存算一体对于符合的应用会带来较高的性能收益和能效收益,这种方式尤其适用于人工智能应用。
现在的CPU大部分建立在诺依曼的方法基础上,然而数字的基本算法来说,新的计算完全可以搞成矩阵式的,但是这里也有进位的问题,进位使得矩阵运算不能够从前面输出先得到的部分计算结果,然而中国古代的掐头算发利用了提前判断的进位,这样计算结果得出就不是从低位到高位,而是从高位到低位,这样刚算出来的高位结果马上又被第二个计算器使用组成下一步的运算高位结果,如此数字分割的每一段都可以同时参与运算,并且一个数字还没有算玩的时候,后面要进行的运算的高位就已经参与的运算,这一切就像一个流水线一样,这种算法的概念在存算一体芯片中间可以得到高效发挥。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-9-27 09:18
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社