Kara0807的个人博客分享 http://blog.sciencenet.cn/u/Kara0807

博文

AICC2019丨摩尔定律终结,如何支撑自动驾驶汽车的算力需求

已有 3155 次阅读 2019-8-30 09:23 |个人分类:自动驾驶|系统分类:科普集锦

 AICC2019丨摩尔定律终结,如何支撑自动驾驶汽车的算力需求

原创: 张良 智车科技 


1.jpg


芯片技术经历了复杂指令集、简化指令集、阿姆达尔定律、摩尔定律时代,在每秒产生海量数据的当下,晶体管数量以每年50%的速度增长,但CPU的性能每年仅增长10%,现阶段设计人员创造可以实现更高指令级并行性的CPU架构越来越难了。


与此同时,深度学习模型对数据和计算能力需求急剧增加,自动驾驶等AI技术产业对计算平台提出了更高的要求,算力成为人工智能时代一大制约因素。


自动驾驶的实现,需要依赖感知传感器对道路环境的信息进行采集,将采集到的数据传送到汽车中央处理器进行处理,用来识别障碍物、可行道路等,最后依据识别的结果,规划路径、制定速度,自动驱使汽车行驶。整个过程需要在一瞬时完成,延时必须要控制在毫秒甚至微秒级别,才能保证自动驾驶的行驶安全。要完成瞬时处理、反馈、决策规划、执行的效果,对中央处理器的算力要求非常高。


计算⼒是承载和推动⼈⼯智能⾛向实际应⽤的基础平台和决定性⼒量,8月28日,由中国工程院主办、浪潮集团承办的2019中国人工智能计算大会(AICC2019),围绕人工智能的产业需求深度研讨了AI计算难题与发展机遇。


2.jpg

 

人工智能需要定制化计算


AI计算是整个计算构架中算力需求最大的一个部分,自动驾驶的等级提高伴随着指数递增的算力需求,计算平台需要克服算力的利用率、有效算力以及算力转化的效能问题等。


会上,英国皇家工程院院士、鲲云科技首席科学家陆永青也表示,一种软硬结合的定制化计算,可以提升芯片计算效率和实测性能现在定制化计算还是人在设计,对于定制化计算的未来设想,定制化应可以完成自我验证和自我优化,达到自动化的定制计算设计。


中国新一代人工智能发展战略研究院执行院长龚克也表示:新一代人工智能需要新一代超级计算,不仅要在运算的速度上达到新水平,而且要在智能化应用上形成新局面智能计算作为ICT核心一环,将加速5G、云、视频、IoT、AI以及等创新技术与产业的互相融合,并向更为广阔的行业延伸。


浪潮集团AI&HPC总经理刘军在会议现场,发布了《2019-2020中国人工智能计算力发展评估报告》,这份报告中提到:算法、数据和算⼒是⼈⼯智能的三⼤要素,其中数据的获取以及处理的难度在慢慢下降,算法也在多种深度学习的框架上不断优化。因此,市场将⽬光聚焦在将数据和算法协调起来的芯⽚上。⽬前,⼈⼯智能芯⽚⼤致可分为以下⼏类:


3.jpg


按照⼯作负载,⼈⼯智能芯⽚可以分为训练芯⽚和推理芯⽚,训练是指在已有数据中学习,获得某些能⼒的过程,对计算的精度要求较⾼,它直接影响推断的准确度。这就要训练芯⽚有强⼤的单芯⽚计算能⼒,⽬前GPU芯⽚更适合⽤于训练负载。⽽推理过程则是指对新的数据,使⽤这些能⼒完成特定任务(⽐如分类、识别等)。⼈⼯智能服务器采⽤异构架构进⾏加速计算,可以分为CPU+GPU、CPU+FPGA、CPU+ASIC等多种形式。


报告中提到,未来⼈⼯智能软件框架及模型将向越来越复杂的趋势发展,解决⽅案提供商必须有能⼒提供⾜够的算⼒,才能为⽤⼾建设优质的⼈⼯智能应⽤平台。除了硬件层⾯,供应商还应该有能⼒针对不同应⽤开发针对性的软件平台,进⼀步提⾼算⼒。另一方面,随着⾏业应⽤场景的不断丰富,解决⽅案提供商,尤其是初创企业应该有明确的聚焦领域和细分市场,建⽴⾃⾝的核⼼竞争⼒,为⾏业⽤⼾提供更加个性化的解决⽅案。


车载人工智能计算平台需求


4.jpg


在本次会议的自动驾驶分论坛中,广汽研究院智能驾驶部部长郭继舜作了题为《自动驾驶量产的算力思考》的报告,他提到为了节省算力,业界采取了压缩算法和使用相对稳定的多芯片组合的方法,去完成一个功能。他认为人工智能芯片,特别是使用在智能驾驶上的芯片,还需要有更好的产品推向市场,才能够满足未来的自动驾驶的发展。


目前车载智能计算平台大多采用异构芯片硬件方案,面向L3及以上等级自动驾驶车辆,车载智能计算平台需要兼容多类型多数量传感器,并具备高安全性和高性能。现有车载智能计算平台产品如奥迪zFAS、特斯拉FSD、英伟达Xavier等硬件均主要由 AI(人工智能)单元、计算单元和控制单元三部分组成,每个单元完成各自所定位的功能。


中国软件测评中心发布的《车载智能计算基础平台参考架构》中也提到,L3及以上等级自动驾驶功能要求车载智能计算基础平台具备系统冗余、平滑扩展等特点一方面,考虑到异构架构和系统冗余,利用多板卡实现系统的解耦和备份;另一方面,采用多板卡分布扩展的方式满足自动驾驶L3及以上等级算力和接口要求。整体系统在同一个自动驾驶操作系统的统一管理适配下,协同实现自动驾驶功能,通过变更硬件驱动、通信服务等进行不同芯片的适配。车载智能计算基础平台需具有弹性扩展特性以满足不同等级自动驾驶需求。


针对L3及以上等级自动驾驶汽车,随着自动驾驶等级提升,车载智能计算基础平台算力、接口等需求都会增加。除提高单芯片算力外,硬件单元也可复制堆叠,自动驾驶操作系统弹性适配硬件单元并可进行平滑拓展,达到整体系统提升算力、增加接口、完善功能的目的。

 

随着摩尔定律的日渐终结,芯片技术正以不同的架构组合延伸着自己的算力,与此同时,传统的⼈⼯智能算⼒也在进⼀步向云端及边缘扩展,构建更灵活、更具成本效益的⼈⼯智能应⽤部署。对于自动驾驶来讲,一种能够提供可靠、稳定、高效算力的车载智能计算基础平台也已进入顶层设计。




https://blog.sciencenet.cn/blog-951291-1195850.html

上一篇:为何人人都识华罗庚,却不知这位数学界神级大佬苏步青?
下一篇:智车科技第35周自动驾驶周刊 | 全球首个纯固态激光雷达量产合作达成;日产/ Mobileye 合作研发ProPilot
收藏 IP: 159.226.177.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-25 17:34

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部