9 月 3 日,第二届全球 IC 企业家大会暨第十七届中国国际半导体博览会(IC China 2019)在上海召开,本届大会主题为“开放发展 合作共赢”,由工业和信息化部、上海市人民政府指导,中国半导体行业协会、中国电子信息产业发展研究院联合主办。地平线作为在 AI 芯片领域的先锋创业企业受邀参加本届大会,于上周宣布量产了中国首款车规级人工智能芯片——征程二代的消息也在整个半导体行业内引起不小的震动,创始人兼 CEO 余凯也在会上向 IC 同行和产业相关人士们阐述了地平线就车规级 AI 芯片研发和落地的产业布局。

 

 

边缘计算是应对终端数量激增和海量数据计算挑战的关键

余凯在演讲伊始提到,计算的变迁一直围绕着终端的变化,计算终端变迁将助力计算机发展史,迎来 AI 新时代。5G 时代将产生无处不在的 AI 节点,同时也会看到,时代主流的变化,智能机器的数量,将会数倍于全球总人口数,蕴含前所未有的商业机会。这对边缘计算来说,会有一定的发展空间。

 

边缘计算可靠性高、低延时、低传输存储成本、脱敏合规等特点更符合无人驾驶的应用场景需求,是应对终端数量激增和海量数据计算挑战的关键。目前大家的关注点都在 4 级、5 级的无人驾驶,余凯认为 3 级自动驾驶是一个转折点,是人机交互的切换点,目前真正在产业界规模化量产的是 2 级、2.5 级的辅助驾驶,人工智能计算在辅助驾驶方面,可以提高安全性。他说“无人驾驶毫无疑问是车载人工智能计算最有想象力的未来,但是今天无人驾驶始终还有一些关键问题需要解决,它是确定性的未来,但是当下来讲,人工智能计算还在辅助驾驶的阶段,我们不是说替代司机,而是让司机驾驶更加安全、体验更好,包括车载娱乐导航的人机交互,包括高精度地图众包的生产,边缘计算已然在自动驾驶到来之前,可以产生巨大的市场规模。”

 

 

智能驾驶的发展亟待更强大的边缘处理器

边缘计算虽然不是数据中心,但它的计算负载同样很大,一辆自动驾驶车辆平均每天产生 600-1000 TB 的数据计算,仅 2000 辆自动驾驶车辆产生的数据量超过 2015 年我们整个文明一天数据用量,大规模设备端部署需要成本效率。根据摩尔定律,在过去的发展过程中,推动的不仅仅是 IP 层,还有人工智能层,都受到推动。如果摩尔定律继续,未来 1000 美金,我们就能买到等同于大脑的算力。如果无人驾驶更加智能化,则亟需更强大的边缘处理器。

 

地平线征程二代处理器在此背景下应运而生,其搭载自主创新研发的高性能计算架构 BPU2.0(Brain Processing Unit),可提供超过 4 TOPS 的等效算力,典型功耗仅 2 瓦,且具有极高的算力利用率,典型算法模型在该芯片上处理器的利用率可以高于 90%,能够高效灵活地实现多类 AI 任务处理,对多类目标进行实时检测和精准识别,可全面满足自动驾驶视觉感知、视觉建图定位、视觉 ADAS 等智能驾驶场景的需求,以及语音识别,眼球跟踪,手势识别等智能人机交互的功能需求,充分体现 BPU 架构强大的灵活性,全方位赋能汽车智能化。


 


地平线征程二代芯片核心参数

 

在能效比和开放性方面,征程二代具备显著优势。打造极致的 AI 能效是地平线芯片设计的核心理念。基于这一理念,征程二代芯片具备极高的算力利用率,每 TOPS AI 能力输出可达同等算力 GPU 的 10 倍以上。与此同时,征程二代还可提供高精度且低延迟的感知输出,满足典型场景对语义分割、目标检测、目标识别的类别和数量的需求。征程二代全面开放,提供从参考解决方案,到开放的感知结果,再到芯片及工具链的基础开发环境,并可依据客户的不同需求提供不同层次的产品交付和服务。

 

 

为什么地平线能够将 AI 处理器的算力利用率做得如此之高?原因在于地平线在 AI 处理器设计的初始就开始从整个芯片的系统级设计和芯片级别角度上思考 SoC 的设计思路,将经典芯片设计思想和带宽利用率优化结合在一起,注重真实的 AI 能力输出,既守住主效能又兼顾灵活效能的 BPU 思想。同时,地平线还从能源转化为计算的效率、算力成本、算力利用率和算力转化为 AI 输出的效率四个指标率先重新定义了 AI 处理器的真实性能。并且前瞻性的对重要应用场景中的关键算法发展趋势进行预判,提前将其计算特点融入到计算架构的设计当中,使得 AI 处理器经过一两年的研发,在推出的时候,仍然能够很好地适应时下最新的主流算法。因此,和其他典型的 AI 处理器相比,地平线的 AI 处理器,随着算法的演进趋势,始终能够保持相当高的有效利用率,从而真正意义上受益于算法创新带来的优势。

 

光有这些还不够,大家并不能够很好把这种处理器和算法高效算法利用起来,怎么办呢?地平线还推出了全栈式工具链 Horizon OpenExplorer(“天工开物”开发工具链),包括核心转化工具模型结构检查性能分析、编译器、模拟器,输入可以是各种开源主流的深度学习框架产生出来训练模型,输出可以部署到人工智能处理器高效运行的模型,使用起来非常方便。

 

车规级芯片产品开发周期长,难度大,是硬科技、长跑道的创新

车载 AI 芯片被余凯看做是人工智能行业的珠穆朗玛,也是自动驾驶实现大规模落地的前提。众所周知,车规级芯片需要满足“高安全性、高可靠性、高稳定性”的技术标准要求,并需要经过严苛的研发、制造、封装、测试和认证流程,产品开发周期长,难度大,余凯说“需要有超强的耐力、耐得寂寞才能把这件事情做好”。地平线征程二代从设计之初就严格按照汽车电子可靠性标准 AEC-Q100 的要求进行。

 

 

地平线明年目标推出面向 L4/L5 征程三代芯片,整个计算能力达到 192TOPS,功耗仅 48 瓦,实际车载计算算力将是特斯拉自动驾驶平台的三倍。

 

关于车规级芯片的研发,地平线也给出了明确的发展路线图:

 

明年,地平线将发布 16nm 的 J2A。而地平线的第三代车规级 AI 处理器 J3,性能将达到域控制级 L3,符合功能安全车规级,除了满足可靠性 AEC-Q100,还符合功能安全,芯片达到 ACILB,系统达到 ACILD,并有保密价值加密机制,整体提供了安全可靠的芯片为自动驾驶护航。J3 将基于 BPU3.0 架构,协同 CPU、CV 等形成异构计算,在智能驾驶场景下达到最优。其整个 SoC 支持多达 8 路以上的视频输入,并支持 4K,地平线会将包括数据通路在内的整个架构做优化,最后达到一个极好的效果。

 

之后,地平线还会推出 J3 max,目前已在规划中,预计会采用 7nm 等更先进工艺,针对 L4、L4+高性能车规级处理器,可支持多达 12 路,算力达 100TOPS,功耗目标是 25 瓦,芯片等级达 C 或 D。


最后余凯指出,随着地平线这样的 IC 玩家不断往前奔跑,整个行业不断推进摩尔定律往前发展,车载的计算从分布式 ECU 架构,演进到现在的主流预控制器,到 2025 年会往中央计算单元去发展,汽车会展现出跟今天我们理解的 PC 还有移动产业发展格局本质属性,会变成四个轮子上面超级计算机。