中心打算能在降落本钱的同时提高通信效率,还可以实现远程升级(OTA),让智能汽车也能像智好手机一样持续升级,拥有更好的智能化体验。既然是中心打算,芯片的安全性和性能都尤为主要。
“随着自动驾驶接管车辆的韶光越来越长,汽车芯片的功能安全将无法忽略。”Imagination Technologies车载GPU产品线的产品总监章政指出,“在车上用消费级芯片只是短期过渡。”
目前大量的智能汽车虽符合国家的法规哀求,但考虑本钱等多方面的成分,知足的是系统级安全,整车符合汽车安全哀求,但利用了一些消费级芯片,而非高档级的功能安全芯片,这是为什么?
最核心的缘故原由还是由于本钱,传统办法要实现功能安全,会带来成倍的本钱增加,阻碍了高功能安全等级的汽车芯片遍及。
近期Imagination发布了业界高档级功能安全和最高性能的汽车GPU IP DXS。
通过创新的分布式安全机制,Imagination DXS GPU对性能的影响险些为零,芯片面积的代价估计仅为10%,实现了ASIL-B功能安全等级。
并且Imagination DXS GPU IP,峰值性能比Imagination上一代汽车GPU提高了50%,可扩展至192 GPixel/s、6 TFLOPS和 24 TOPS,AI性能更是有高达10倍的提升。
Imagination的全新产品无疑将推动高功能安全等级车载芯片在智能汽车中的遍及。
用10%的芯片面积代价,实现高档级功能安全
所谓功能安全,指的是确保芯片按照设计的功能运行。如果芯片不能按照汽车设计的功能实行,可能会威胁到驾驶员、搭客、路人的安全。
要达到功能安全,就要付出一定的本钱,比如招聘有履历的设计职员,实行严格的功能安全研发流程,进行安全认证等。
对付芯片来说,实现功能安全最主要的成本来自增加的芯片面积,由于所有新功能的实现,都须要增加芯片面积。
实现汽车芯片功能安全有两种常见的办法,一种双核锁步法,另一种是事情负载重复法。
双核锁步法用两个相同的逻辑单元实现同一个功能,同时实行任务比较结果是否同等,如果同等解释逻辑运行精确。通过双核锁步法实现功能安全的代价是多一倍的芯片面积。
事情负载重复法,便是把同一个事情实行两次,比拟两次的结果是否同等,这种方法可以避免随机缺点,但难以避免长期缺点,并且由于要进行两次重复的事情,相称于性能降落为二分之一。
无论是双核锁步法增加一倍的芯片面积,还是事情负载重复法相同的芯片面积性能降落一半,实现功能安全的代价都是十分高昂,自然难以遍及。
自动驾驶逐步遍及之后,汽车芯片的功能安全就难以被忽略。如何才能用最小本钱实现高档级功能安全?
Imagination DXS首创性地实现了仅增加10%的芯片面积,对GPU的性能险些零影响,通过分布式安全机制实现了ASIL-B功能安全。
根据ISO 26262汽车安全完全性等级(ASIL)体系,ASIL-A等级的哀求最低,ASIL-D等级的哀求最全面。
“本日我们可以轻松达到ASIL-B,这个等级基本可以知足L2级自动驾驶的需求。如果须要更高功能安全等级,可以通过2个ASIL-B系统交叉确认实现。未来我们会进一步提高安全等级。”章政见告雷峰网。
Imagination DXS能够以足够小的代价,实现足够高的功能安全等级的核心是利用了处理器固有的并行性,以及任何线程都不会被完备利用的事实。
也便是说,DXS会利用一个GPU线程等待的韶光,插入安全测试,利用相同的安全测试在另一个线程等待时插入,实行完成后比拟结果是否同等。
这是DXS实现高档级功能安全逻辑模块的功能安全,也是实现全体功能安全的难点所在,须要能够迅速在模块中定位缺点,这只是实现功能安全的个中一半。
DXS另一半的功能安全是内存,包括Cache或SRAM。章政先容Imagination会通过ECC、parity或者CRC校验,担保内存的功能精确。
Imagination通过独特的分布式安全机制(DMS),利用空闲时一直发送很小的测试向量,在ASIL标准设定的韶光范围内识别故障,实现高档级功能安全。
DXS在实行安全干系的任务时,效率是同级别竞品的2倍,再借助分布式功能安全机制,DXS的上风还能翻倍。
Imagination已经为这个机制申请了专利。章政说,“DSM机制不仅可以用于车载电子,对付功能安全哀求高的其它的领域,比如航空、医疗和工业,也都适用。”
AI性能的数量级提升
对付自动驾驶汽车芯片,与功能安全同样主要的是高性能。由于自动驾驶仍在不断发展,智能化功能在不断扩展,高性能和可扩展性都非常主要。
得益于增加了一个新的SPU单元,利用5nm节点,算力可从单核0.25 TFLOPS的配置,扩展到1.5 TFLOPS的处理能力,DXS的性能比较上一代XS整体提升了50%。
Imagination为SPU做了很多优化事情,比如增加了2D双速纹理处理(2D dual-rate texturing),更新了固件处理器(firmware processor),新增了可变分辨率渲染(fragment shading rate)。
整体而言,对付渲染类任务,DXS单位面积的性能赶过竞品2倍。对付以打算为中央的图形处理任务,DXS单位面积性能赶过竞品28%旁边。
自动驾驶芯片的AI性能也值得单独关注,这是实现更高等别自动驾驶的关键所在。
4核配置的DXS,用于FP16半精度浮点打算时,DXS能供应12 TFLOPS的性能;用于int8打算时,DXS能供应254TOPS。
“这是运行在1GHz主频上的数据,如果芯片设计公司后端能力够强,DXS可以运行在1.2GHz乃至1.5GHz的主频,其性能将更高。”章政表示,“我们研究创造,大部分AI负载FP16的精度就足够知足哀求,FP32确实有更高精度,但带宽会增加一倍,系统可能没办法供应这么高的带宽。当然我们的DXS也支持FP32。”
带宽也是限定汽车ADAS实现的主要缘故原由, Imagination DXS增加了片上存储,只管即便把所有打算都掌握在一个GPU内,大幅降落系统的带宽需求。
不过对付发挥芯片的AI性能,上层的软件同样关键。
由于GPU的人才相对匮乏,为了让开发者充分利用GPU的性能,Imagination开拓了一系列库,比如几何库、BLAS库(imgBLAS),专门的CNN 库(imgNN),还有专门处理车载事情的库,如处理雷达数据须要的FFT库(imgFFT)。
Imagination的目标是帮助软件开拓职员实现高达80%的GPU利用率。
这些库与新的参考工具包oneAPI和TVM相结合,构成了一个基于开放标准的实用软件栈,软件开拓职员可以利用该软件栈轻松地将其打算运用移植到基于Imagination IP的硬件上,并最大限度地提高其性能。
DXS AI性能的提升比较上一代高达近10倍。个中,硬件性能大概提升了50%,以是更大的的提升来自软件的支持和协同。
“打算库提升了2-4倍的性能,采取双速率FP16带来了3倍提升,以是DXS在范例事情负载上带来了6-12倍的性能提升。”章政表示,“DXS大模型、路况视觉不雅观察、驾驶员行为监测、激光雷达系统数据处理等方面已经具备了商用能力。DXS覆盖从座舱到L2/L3自动驾驶的需求,DXS 8-256 MC1紧张用于低本钱的HMI运用,最高真个IMG DXS-48-1536 MC4知足ADAS的这个需求。”
不同的公司可以根据产品定位,灵巧选择得当的配置,乃至可以不才一代产品更新时增加一个新的GPU模块。
这就离不开DXS硬件和软件的灵巧性。
为了应对高端制程大芯片良率越来越低的寻衅,DXS原生支持小芯片(Chiplet)封装,这得益于Imagination内核之间的低带宽总线和对隔离的支持。
软件层面,基于硬件的虚拟化技能使Imagination GPU能够同时运行8个操作系统,并通过完备的内存隔离,实现完备安全的GPU多任务处理。
目前Imagination的汽车GPU支持OpenGL ES、Vulkan、OpenGL和OpenCL。它们可运行盛行的汽车操作系统,如QNX和Green Hills软件公司的INTEGRITY RTOS,以及Linux和Android。
随着高安全等级且高性能DXS的发布,高功能安全的汽车芯片的遍及将扫清障碍。