加入星计划,您可以享受以下权益:

  • 创作内容快速变现
  • 行业影响力扩散
  • 作品版权保护
  • 300W+ 专业用户
  • 1.5W+ 优质创作者
  • 5000+ 长期合作伙伴
立即加入
  • 正文
    • 探究地平线的造芯理念
    • “软硬结合”还需“软硬解耦”?
    • 软硬结合,征程5计算性能再攀升
    • 完整、成熟、易用的整车开发平台亦是关键
    • 写在最后
  • 推荐器件
  • 相关推荐
  • 电子产业图谱
申请入驻 产业图谱

地平线黄畅:以终为始,自动驾驶没有什么神仙技术

2022/07/13
3744
阅读需 16 分钟
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

在可预见的将来,一辆汽车甚至相当于现在数据中心算力级别,说它是“轮子上的数据中心”也不为过。在自动驾驶芯片竞争日趋白热化的今天,似乎算力越大越有安全感。就在这个高度“内卷”的赛道上,一家中国初创企业直言,“已经和英伟达提前锁定了决赛席位。”

自动驾驶芯片门槛高、投入大、回报周期长,一颗芯片和车企达成前装量产合作,要经历重重考验。一家初创企业何以有这样的信心?拥有了什么“神仙技术”?

探究地平线的造芯理念

日前,在地平线的“征程5技术开放日”上,地平线高级市场总监陈遥在开场演讲中用了一个比喻:“如果把大算力自动驾驶的比赛比喻为世界杯,那么地平线与英伟达已经率先进入百TOPS芯片前装量产的阶段,并提前锁定了决赛席位。”

地平线“征程5”号称是国内首款实现前装量产的百TOPS大算力AI芯片。今年上半年,“征程5”先是在实车环境下完成了城区复杂场景自动驾驶的闭环验证,之后,多家软件生态伙伴开始陆续推出基于“征程5”开发的高等级自动驾驶方案与原型Demo。从目前的规划来看,年内,“征程5”将完成全部车规可靠性测试与全面功能安全认证工作,达到量产成熟水平,基于“征程5”芯片的首个量产项目也会在年底正式量产(SOP)。

地平线联合创始人&CTO黄畅在接受<与非网>采访时表示,地平线的造芯理念可以概括为“以终为始”,即始终用系统的视角,去审视每个模块的设计与实现。通过大量基准测试及仿真平台的指导,抓住关键环节予以突破,进而再整合为一套系统。

他补充,这个技术理念跟特斯拉很像,但即使是特斯拉也没有任何一项技术是神仙技术。一旦谈产品、谈技术,面对的就是一个复杂系统,要解决的就是真实市场中的复杂问题。任何一个单项的技术它是否真的在解决主要矛盾、主要问题?还是说花了很大力气去提升一个模块,如果这个模块只占整个系统的1%,你把它优化100倍也没有什么意义。因此,根本不存在所谓单项技术“一招鲜,吃遍天”的做法,不存在“靠一项技术支撑起一整套系统”这件事情。

基于上述原因,黄畅表示,地平线非常注重软硬件的结合。“结合对算法的预判来设计整个系统中的算法、软件、硬件,其中,仿真平台是支撑设计高效运作的关键工具,而且是持续积累迭代的。通过不断仿真、测试,不断地从系统到模块、再从模块到系统进行调校,才会让你的能力越来越强,才会让你看未来的能力越来越强”,他强调,“设计本身就是基于对未来预判的抽象化表达,设计能力决定了技术型公司真正的核心竞争力,其实也就是预判未来的能力,能从定性的预判转成定量的设计。”

“软硬结合”还需“软硬解耦”?

谈及地平线的技术路线,黄畅强调了“软硬结合”和“软硬解耦”。

所谓软硬结合,是指一个计算平台的软件和硬件架构,在设计阶段需要充分考虑它们如何结合、如何能够更加高效地支持未来的算法趋势;而软硬解耦则是,当一个计算平台已经开发完成,它的硬件和软件提供给开发者去使用时,需要支持软硬解耦,本质上是算法、应用开发和计算平台的解耦。也就是说,软硬结合是针对计算架构设计阶段;软硬解耦则是指使用阶段、开发阶段,主要是从应用开发角度出发的。

黄畅表示,对于AI计算架构,通过软硬协同进行优化,才能实现高效、灵活的新一代架构。传统上芯片强调“PPA”,但是AI芯片往往强调的是APPA,第一个“A”就是指Accuracy,即算法的精度。

那么,如何通过软硬结合实现好的APPA?

硬件方面,包含片上存储阵列、张量计算组织、还有围绕计算架构的中间件指令集定义等等,都非常关键。软件设计方面,则要针对每个特定的算法进行分析,如何拆解重组,使之实现最大化的可并行性,使得一个算法在芯片推理过程中的效率足够高、延迟尽可能低、带宽尽可能节省;同时,数据并行、一站式分析也能发挥很大作用;片上存储管理和指令调度则覆盖了算法在芯片上运行的全过程。

以地平线BPU核心的AI计算架构为例,首先是对计算架构的建模。通过建模,针对任何一个指令序列,可以给出硬件的配置情况,并且可以去评估这个指令序列(其背后实际对应具体算法,通过编译器转化成指令序列)再加上硬件配置的情况,可以评估该算法跑在芯片或是BPU架构设计上,它的关键性能指标情况如何;另一方面,对应来自于Testing benchmark的算法,结合硬件架构信息,可以对模型的性能进行分析,这个时候相当于进行部署时的评估,主要关注性能和精准度。

在软硬结合理念的指引下,地平线的BPU架构,基于异构计算实现了良好的算力密度和能效比;软件架构方面,通过编译优化,最大程度利用了存储和计算资源,从而能够在更短的时间内完成AI推理任务;并且聚焦真实场景,通过对神经网络协同优化的计算架构,最终实现高效计算。黄畅表示,可以说第三代BPU贝叶斯架构,凝聚了地平线对AI、深度学习、自动驾驶场景的深度洞察,是先进处理器技术的集大成者。

软硬结合,征程5计算性能再攀升

地平线检测软硬结合的设计理念,在征程5上已经得到了佐证。最新数据显示,在硬件架构和算法都没有改变的情况下,征程5的AI计算性能,从最初发布时的1283FPS提升到了当前的1531FPS,性能提升近20%。黄畅透露,这主要受益于软件架构的改变,地平线的理念始终是:能让软件做的事情尽可能让软件做,硬件做简单、极致、高效且容易被软件灵活调用的功能。

这意味着,哪怕架构锁定、算法锁定,软件架构还可以持续进行改善,编译器还可以持续把同样一个算法在同样一个芯片上,通过编译、拆解、重组、部署和运行去进行调度,从而不断优化。

黄畅分享了对于AI芯片开发趋势的一个洞察,他认为,算法是客观大趋势,对于AI芯片公司、计算平台公司来说,更多只能去预判、去识别,而所能掌握的两个要素就是硬件架构和软件。所以,在芯片定义阶段,需要多关注硬件计算架构如何被算法定义;当芯片开发完成,需要聚焦如何通过编译去优化软件,实现更强的计算性能。

至于如何评估一颗AI芯片的效能?黄畅认为,最合理的指标就是FPS/Watt或FPS/$,也就是芯片为了达成AI处理性能所付出的功耗和成本。

他将体现真实AI效能的FPS/Watt或FPS/$指标分成三部分解释。如下图,第一列TOPS/Watt & TOPS/$数值由硬件架构决定,通过芯片架构和制程工艺的演进可以持续改善;中间一列Utilization则属于软件架构,也就是征程5性能提升的关键;最右一列的FPS(Frames Per Second),即为实现单位有效算力的算法处理速度,更能反映AI芯片的真实计算性能。FPS由算法架构决定,也被称之为算法领域的新摩尔定律,大约会在9-14个月的时间内将AI任务需要的计算次数和复杂度降低一半。

黄畅强调,地平线关注峰值算力的持续提升,但本质上更加关注有效算力的提升。算力大、更要算得快。在他个人看来,自动驾驶L2+级最好就能达到百TOPS量级,因为随着全场景自动驾驶的复杂度越来越高,没有足够有效的算力进行处理,将很难满足实际需求。

依照这个评估标准,在典型分类模型下,征程5在处理单帧输入的百万像素大图时,其性能达英伟达Xavier的 6.2倍;针对高效模型(EfficientNet)更接近自动驾驶场景的物体检测,同精度下,征程5的性能是Xavier的9倍多,Orin的近3倍;能效比方面,在达到更高性能的条件下,征程5的能效比接近Orin的9倍。
 

完整、成熟、易用的整车开发平台亦是关键

对于一款车规级AI芯片来说,性能上吊打对手只是一个关键因素,更重要的是,需要提供全方位的安全保障和完整、成熟、易用的整车开发平台。目前,地平线已拥有完整的安全认证体系,征程5完整芯片方案均符合ASIL-B产品认证标准。那么,如何基于这些既有优势和积累,进一步扩大产品应用生态?这应该是地平线当前在大力布局的重点。

地平线智能驾驶产品规划与市场高级总监吕鹏坦言,“当前,汽车智能化从开发到交付全流程的效率其实并不高。如果没有操作系统和开发工具链的支持,一颗空有算力的AI芯片,不但无法运行,也直接降低了整体的开发效率。”

要和车企达成前装量产合作,支撑车企各类车型的量产落地,自动驾驶芯片设计还必须考虑能效比、算力和效率、芯片适配性、灵活性和全面性、开发便捷性、安全认证等多项关键评估指标。

也正是如此,地平线提供了从最底层的开发套件与参考设计,到基础操作系统、应用中间件,再到各类算法、AI芯片及软件栈的一整套丰富、成熟、完善的系统工具,希望能够帮助用户大幅降低在地平线芯片平台的开发难度、投入成本,缩短开发时间,提升开发效率。

对芯片来说,量产与否,其实是一个很大的分水岭。也只有芯片量产之后,这些工具才有可能被别人使用。吕鹏表示,好的工具链很多时候都是“用出来的”,它的成熟度靠大量的用户、开发者,一步步去使用、迭代、升级,最终才形成了一套完整易用的开发平台。

地平线征程2、征程3到现在的征程5大算力平台,已经构建起了包括芯片、硬件、基础操作系统、应用中间件、分布式算法等一系列完整的平台工具。

例如AI开发套件,除了征程5芯片,还包括了征程5 EVM开发版、征程5 SOM、PCIe形式的集群加速卡、Matrix 5整车智能计算参考平台。其中,Matrix 5是更接近于量产级的参考设计,包括单颗/双颗/4颗征程5硬件方案,对应算力从128TOPS到最高512TOPS,而且这些硬件方案都提供了相应的原理图参考设计,有助于快速开发设计。

目前,已有包括大陆集团、东软睿驰、立讯集团、联成开拓在内的10家合作伙伴推出了基于Matrix 5相关参考设计的域控产品;近期,地平线还官方授权了3家硬件IDH合作伙伴:映驰科技、金脉、天准;还有多家合作伙伴在行业中拿到了车型的定点,面向相关的量产项目去进行相关的开发和交付。

开发工具方面,地平线有天工开物平台和艾迪平台。其中天工开物的AI工具链可以提供非常高效的自动化环节,帮助客户以最小的精度损失实现量化的过程;AI的艾迪开发工具平台是地平线面向软件2.0趋势的一个背后引擎,它是一个能进行高效AI训练、测试和管理的工具平台。

写在最后

大算力自动驾驶芯片的发展已驶入快车道,征程5最晚今年年底搭载上车,从平台性能和“卡位”的时间节点,以及百万级出货、处理问题的方法论、体系流程的建设、对自动驾驶理解的Know-How等要素来看,地平线都已经拿到了“决赛”资格。不过,接下来的布局和发展规划仍非常关键。

业内曾把开发自动驾驶AI芯片比作攀登珠穆朗玛峰,但事实上,开发出一颗算力彪悍、效能优越、且最终实现量产、完成所有车规认证的芯片,离峰顶仍有不小的距离。不妨说,真正要翻越的珠峰,不是芯片本身,而是庞大的生态体系建设。

这个高速发展的赛道当前所处的阶段就决定了,行业生态需要“极致的开放度”。从车企的角度,希望在基于某一平台的基础上,有更多、更丰富的供应模式;从地平线的角度,定位于Tier2,通过芯片+工具链和平台,希望达成越来越多的生态合作、触达更多的资源,支持Tier1和OEM完成量产和交付。

正如采访中,地平线所传达出的一个关注点:如何客户和合作伙伴带来最大的价值?这是其未来关键,也只有这样,才能获得更好的商业回报,才是这个赛道保持前进的最大动力。

推荐器件

更多器件
器件型号 数量 器件厂商 器件描述 数据手册 ECAD模型 风险等级 参考价格 更多信息
FNB33060T 1 onsemi Intelligent Power Module, 600 V, 30A, 60-TUBE

ECAD模型

下载ECAD模型
$18.57 查看
A3977SLPTR-T 1 Allegro MicroSystems LLC Stepper Motor Controller, 2.5A, NMOS, PDSO28, TSSOP-28

ECAD模型

下载ECAD模型
$5.5 查看
A3987SLPTR-T 1 Allegro MicroSystems LLC Stepper Motor Controller, 1.5A, NMOS, PDSO24, MO-153ADT, TSSOP-24

ECAD模型

下载ECAD模型
$5.27 查看
地平线

地平线

地平线是边缘人工智能芯片的全球领导者。得益于前瞻性的软硬结合理念,地平线自主研发兼具极致效能与开放易用性的边缘人工智能芯片及解决方案,可面向智能驾驶以及更广泛的通用 AI 应用领域,提供包括高效能边缘 AI 芯片、丰富算法IP、开放工具链等在内的全面赋能服务。目前,地平线是国内唯一一家实现车规级人工智能芯片量产前装的企业。

地平线是边缘人工智能芯片的全球领导者。得益于前瞻性的软硬结合理念,地平线自主研发兼具极致效能与开放易用性的边缘人工智能芯片及解决方案,可面向智能驾驶以及更广泛的通用 AI 应用领域,提供包括高效能边缘 AI 芯片、丰富算法IP、开放工具链等在内的全面赋能服务。目前,地平线是国内唯一一家实现车规级人工智能芯片量产前装的企业。收起

查看更多

相关推荐

电子产业图谱

与非网资深行业分析师。主要关注人工智能、智能消费电子等领域。电子科技领域专业媒体十余载,善于纵深洞悉行业趋势。欢迎交流~