智能边缘设备的迅速增加,使得MCU也在发生巨大变化。尽管MCU是当今许多边缘应用的核心,但新一代智能应用对MCU提出了更高的要求,以帮助开发人员满足功率、性能和安全上的复杂需求,掌握各种连接选项,同时平衡系统总成本和能效。

 

日前,恩智浦(NXP)发布了全新的MCX微控制器产品组合,以推动智能家居、智能工厂、智慧城市以及新兴工业和物联网边缘应用领域的创新。该产品组合首次集成了用于加快边缘推理的神经处理单元(NPU),与单独的CPU内核相比,可提供高达30倍的机器学习吞吐量。

 

恩智浦执行副总裁兼边缘处理技术总经理Ron Martino表示:“当我们距离750亿互联设备这个里程碑越来越近时,我们也在进入边缘计算新时代。这要求我们从根本上重新思考如何以合理方式构建一个灵活的MCU产品组合,该产品组合应具有扩展性、经过优化,并且能够成为当今以及未来几十年节能工业和物联网边缘应用的基础。凭借我们在MCU领域的丰富经验积累,这个全新的产品组合将满足实时工作负载的性能和集成要求,引领新一轮创新的浪潮。” 

 

MCX MCU赋能智能边缘

 

恩智浦大中华区工业与物联网市场高级总监金宇杰表示,随着人工智能和智能边缘计算的发展,业界所面临的挑战也越来越多。第一,需要快速发展的技术格局;第二,随着数据的大量传输、运算和处理,对信息安全保护的需求也越来越重要;第三,手持设备、电池应用等领域对低功耗的要求也越来越严苛。

 

回顾恩智浦 MCU产品的发展历程,其中,2007年推出了首款基于Arm集成闪存的LPC系列; 2010年,当时的飞思卡尔推出基于Cortex-M4的Kinetis。到2021年,LPC出货量达到10亿颗,Kinetis已超过1000多个品种。

 

如今,应对智能边缘新的设计挑战,恩智浦基于以往核心技术组合,集合LPC、Kinetis两大系列产品优势,首次推出了MCX MCU产品。据金宇杰介绍,MCX仍基于Arm Cortex-M系列,同时也沿用了恩智浦被广泛使用的MCUXpresso开发软件及开发工具。该系列实现了更高的可扩展性,充分考虑了简化系统设计,可缩短开发周期,为开发者提供更好的体验,以及持续强化片上安全性,这些都是MCX产品希望提供给开发者的组合体验。

 

MCX产品组合包括四大系列:

 

首先是MCX N系列(高性能系列),运行频率为150 MHz~250MHz。该系列融入更多外设,首次在MCU中集成了NPU和DSP两个元素。此外,还嵌入了NXP特有的安全系统EdgeLock。

 

金宇杰解释说,MCU传统上就是做控制工作,但随着产品对智能运算、可预见性的要求越来越多,对运算的要求也大大提升。因此在MCU中嵌入了算力更强的人工智能元素,这是顺应发展的需要,NPU具有高效的计算架构,可实现实时推理。

 

第二是MCX A系列(基准系列),工作频率为48MHz~96MHz,是一款入门级MCU系列,内置定时器、低引脚数、单引脚电源,主要针对成本受限应用进行了优化。

 

第三是MCX W系列(无线连接系列),工作频率为32 MHz~150MHz,集成低功耗蓝牙无线模块和外围器件。该系列旨在简化物联网设备的无线连接,通过高能效的无线连接技术,帮助延长小型互联系统的电池续航时间。

 

第四是MCX L系列(超低功耗系列),工作频率为50 MHz~100MHz,力求实现超低的动态功耗和非常低的泄漏功耗。该系列针对低功耗应用做了优化,且集成了LPC中的低功耗技术。

 

恩智浦边缘处理事业部系统工程高级总监王朋朋表示,MCX是恩智浦推出的全新MCU家族,也是一个崭新的、承上启下的产品系列。N、L、W、A四个不同的系列,可以在跨界处理器和应用处理器之间进行无缝衔接,具有比较好的拓展性;安全功能方面,MCX集成了EdgeLock安全处理单元,继承了恩智浦一贯高安全性特点和可靠的性能;在系统设计上,仍受到恩智浦MCUXpresso软件套件和开发工具的广泛支持;在开发过程中,不论是从之前的LPC、Kinetis移植,还是设计未来的产品,都会是简单、无缝的衔接过程。

 


集成NPU,MCU兼具通用控制和AI处理功能

 

人工智能持续火热了几年时间,市面上以专用的神经处理器居多,不论是神经网络处理器还是专用的人工智能处理芯片。

 

王朋朋认为,MCU集成神经处理单元可以说是迎合时代需求。在CPU旁边增加的NPU协处理器,其内部拥有计算通道,可以实现出色的计算性能和能效。在NPU上进行机器学习运算加速时,比如二维卷积神经网络、点卷积或深度卷积,性能会比Cortex-M33内核加速30倍以上。在她给出的示例中,每个NPU计算管道中有四个计算单元,是一个4×4的计算处理单元。在恩智浦的整个产品家族中,以及未来的其他跨界处理器和应用处理器中,都会采用统一的架构,提供更高性能的NPU加速器。

 

同时,NPU加速器也支持基于eIQ的机器学习软件开发环境,这与恩智浦MCU/MPU基于CPU的开发环境和开发工具保持一致,为用户增加机器学习功能和智能元素提供了便捷。性能层面,可以覆盖32次运算/周期到2000次运算/周期,未来还可以扩展到更高性能或更小单元。

 

她进一步解释说,MCX是恩智浦集成NPU的第一个产品家族,以往运用CPU处理的事项,,例如机器学习的卷积处理现在可以由NPU来完成,而不占用CPU资源。通过CPU和NPU的并行处理,可同时做到控制和外界的交互,因此,人工智能处理和通用的输入输出控制可以并行实现。由此在一颗通用MCU上,既实现了传统MCU功能,也实现了人工智能的运算加速。

 


MCU内置AI特性,触达更多应用场景

 

越来越多的MCU厂商在MCU中集成AI功能,恩智浦如何看待这一趋势?

 

金宇杰表示,AI的应用最开始都是在云端,而现在出现了一个非常明显的趋势:从PC端到嵌入式端的需求越来越大。在落地的项目中,比如人脸/语音识别门锁、以及包括语音识别、物体识别等在内的各种识别装置,都提出了在本地实现更多推理的需求,这样就提高了对边缘计算能力的要求。

 

以往的应用中对一款微控制器的要求往往是,按下按钮就有很快的反应。但现在远不止这样,人们希望处理器本身有预知性,这就需要引入人工智能要素。金宇杰补充说,他相信越来越多的落地项目,会要求边缘计算平台拥有更多的AI功能支持。

 

也正是如此,当前国内很多创业公司纷纷针对端侧、边缘侧推出专用的AI SoC芯片。那么,内置AI特性的MCU与这些AI SoC芯片是什么样的分工合作?

 

王朋朋表示,AI SoC专门针对某一个或某一类应用进行了特别处理,与场景的适配性非常强。而通用MCU的覆盖范围更广,在广泛应用的基础上增加AI特性,可以为更广泛、更通用的市场赋能,帮助他们的产品增加AI特性。从专用和通用的角度来看,二者各有分工。

 

目前,恩智浦内置NPU的MCX可以覆盖32次运算/周期到2000次运算/周期,实现了很大的性能跨度。这主要是为了满足哪些应用场景的需求?

 

王朋朋表示,32次运算/周期至超过2000次运算/周期,确实是很大的跨度,不过在此基础上还要乘以CPU主频,才能得到真正的算力。因此在实际的开发部署中,需要考虑NPU与MCU的组合,比如:MCU的主频多大?需要一个、两个还是四个NPU单元?通常在入门级的MCX系列中,并不追求很高的算力,就不需要太多NPU单元;而在应用处理器中,频率更高,可能会内置更多NPU,达到几个TOPS的算力。

 

一方面,MCX也是针对MCU现有的应用场景进行提升,比如在传统的控制应用基础上增加AI元素:在医疗设备、无人机或者工业控制中加上智能识别、故障检测、语音控制等。

 

另一方面,基于NPU的MCX也为恩智浦带来新的应用场景:比如可以识别物体的秤,只需把物体放在秤上就可以直接结账;在医学检测中,可以用于检测含疟疾的红细胞;在交通出行中,可以帮助智能车识别障碍,自动做出判断和处理等等。

 

金宇杰表示,随着智能化、自动化时代的到来,恩智浦希望继续发挥MCU领域的优势,通过全新的产品组合,赋能新时代工业应用与物联网边缘计算,帮助用户在边缘实现高性能推理。