MCU 和 SoC 在 AI 市场是怎样的竞争关系?去年,AMD 发布了锐龙嵌入式 R1000 SoC,这款产品一个重要应用就是 AI。在采访中,我就这个一问题与 AMD 嵌入式解决方案产品管理和业务开发总监 Stephen Turnbull 先生进行了探讨。

 

Stephen 的回答非常简单,“就拿 MCU 和 MPU 来说,MCU 是微控制器,MPU 是微处理器,显然 MCU 能耗更低,性能也更低,它是根据接收到的数据进行控制操作;MPU 具有更强的运算引擎,可以实现更高的运算和处理能力。”

 

显然,在 Stephen 看来,MCU 和 MPU 比,计算能力尚且差一大截,和 SoC 比更无法相提并论,AI 市场更是没有 MCU 什么事。笔者之所以提出这个问题,是因为 MCU 大厂恩智浦早在几年前就已经开始在 MCU 和 MPU 的融合上进行了探索,并且在 2017 年推出了跨界处理器。

 

MCUAI市场的探索

大家知道,恩智浦的微控制器事业部来自飞思卡尔,并且同时拥有 MCU 和 MPU 两个产品线,在 2015 年,随着飞思卡尔被恩智浦收购,飞思卡尔的 MCU 并入了恩智浦的微控制器事业部,但是这个工程师团队并没有停下来,而是一直致力于新产品研发,2017 年推出的 i.MX RT 系列跨界处理器就将 MCU 和 MPU 的优势融合到了一起。

 

在采访中,恩智浦资深副总裁、微控制器事业部总经理 Geoff Lees 向与非网介绍,“跨界处理器继续向两端延伸,推出 i.MX RT1010 和 i.MX 7ULP。其中 i.MX 7ULP 的主频可以达到 1GHz,而 i.MX RT1010 的单价只有 1 美元。”

 

抛开 i.MX RT1010 的高性价比,i.MX 7ULP 产品的的结构比较有意思,其采用了 Cortex-A7 和 Cortex-M4 双核架构,而且 Cortex-A7 和 Cortex-M4 处于完全独立的两个域中,A7 用来运行 Linux 操作系统,大部分时间处于关闭状态,M4 则用于处理基本任务,保证设备低功耗运行。这样的配置恰好可以满足 AIoT 设备对低功耗和高性能的需求,因此上市后 i.MX 7ULP 很快出货量就达到了 100 万片,这足以证明市场需求有多么旺盛。

 

为了探索 MCU 在 AI 市场的应用,恩智浦不仅提供硬件平台,还推出了机器学习开发环境 eIQ。恩智浦大中华区微控制器事业部市场总监金宇杰表示,“eIQ 可以与市场上几乎所有的开源训练工具、建模、编辑器兼容,现有的所有公开的标准或者客户定制的标准都可以在 eIQ 中进行开发。eIQ 可以帮助客户将训练好的模型转换到嵌入式平台中;另外,客户自己产生的模型,会用到各种开源资源。当用户实现模型时,需要通过 eIQ 环境快速地转换到自己的平台上。”

 

“eIQ 环境让 MCU 实现 AI 功能成为可能。”金宇杰表示,“除了 eIQ 之外,恩智浦与国内人脸识别算法公司合作,把人脸识别技术运行在一个单核处理器上,将原来在云端运营的大模型成功移到了边缘。”

 

虽然作为跨界处理器,i.MX 7ULP 不能叫做 MCU,但是仍然可以看出,至少在边缘端 MCU 实现 AI 是可行的。2019 年,恩智浦推出了全球首款基于 MCU 的语音控制解决方案,获得了亚马逊 Alexa 语音服务(AVS)认证;同年,恩智浦与微软宣布合作推出基于人工智能 (AI)和机器学习 (ML) 的 Azure IoT 异常检测功能。

 

界限就是用来打破的,我们一直认为 AI 市场是 CPU、GPU、TPU 的专属,而 MCU 厂商在划破这个界限。

 

Arm“锦上添花再增两款AI处理器

作为芯片架构供应商,Arm 自然不会对 AI 市场袖手旁观,尤其是面对 RISC-V 阵营在频频逼近,Arm 需要找到新的突破点。在运营策略上,降低产品准入门槛实属无奈之举,如果在技术上无法实现实质性创新就只能走下坡路了。

 

 

最近,Arm 推出了两款 AI 处理器 --Cortex-M55 和 Ethos-U55。从 Cortex-M55 的框架图中可以看出,Cortex-M55 增加一个 Helium,Helium 的技术名称是 MVE(用于 M-Profile Vector Extension),是针对 Cortex-M 系列处理器的 M-Profile 矢量扩展(MVE)技术,旨在为最小的嵌入式设备提供增强的机器学习和信号处理。官方介绍,与前一代 Cortex 产品相比,Cortex-M55 可将数字信号处理性能提高 5 倍,将机器学习性能提高 15 倍。

Ethos-U55 是 Cortex-M 处理器的配套 NPU 加速器,用于解决电池寿命和成本敏感的复杂 AI 计算难题,需要和 Cortex-M55、Cortex-M33、Cortex-M7、Cortex-M4 等产品搭配使用。Ethos-U55 包含 32 至 256 个可配置计算单元,与基本的 Cortex-M55 相比,机器学习性能最多可以提升 32 倍。如果将 Cortex-M55 和 Ethos-U55 进行组合,能为微控制器带来 480 倍的机器学习性能飞跃。

 

前面讲到,恩智浦的 i.MX 7ULP 采用了 Cortex-A7 和 Cortex-M4 的双核架构,如果将 Cortex-M55 引入其中,机器学习性能将会得到更大的提升。笔者认为,唯一值得顾虑的就是成本问题,MCU 市场讲究性价比,尤其是在物联网应用中,MCU 厂商在高性价比的路上不断厮杀,对于用户来讲,成本应该还是最大的考量因素。

 

MCU切入AI边缘芯片市场的机会

早期,AI 芯片的市场争夺主要在云端和数据中心,而随着边缘计算和 AIoT 的发展,AI 芯片的市场争夺逐渐走向边缘。有研究表明,到 2025 年,有 50%的数据需要在网络边缘侧分析、处理、存储,到 2022 年边缘计算市场规模将超过万亿。受边缘计算的影响,边缘 AI 芯片市场也迅速发展。ABI Research 预计,边缘 AI 芯片组市场将从 2019 年的 26 亿美元增长到 2024 年的 76 亿美元。可以预见,AI 边缘芯片正在成为芯片厂商新的争夺点。

 

整体来看,目前 AI 芯片主要应用在云端、终端甚至更小的边缘节点上。云端应用对处理器运算能力要求最高,处理器需要支持不断变化的 AI 推理和训练工作负载,云端市场主要被英特尔、英伟达、谷歌等巨头公司占据;在终端应用中,很多设备逐渐增加了 AI 功能,比如智能手机上的人脸识别,智能音箱上的语音识别等等,主要是高通、联发科、华为、苹果等公司在主导;同样,在更低成本的终端设备上,对计算处理能力要求较低,但是对功耗要求更苛刻,这些设备依赖公共以太网或低功耗广域网进行连接,而这些设备的数量恰恰增长最快。ABI Research 预测,这些设备的出货量将从 2019 年的 90 万台增至 2024 年的 570 万台,CAGR 为 45.5%。

 

Arm 认为,终端 AI 市场将在未来几年出现爆炸性增长。这也是 Arm 近期推出两款 AI 处理器的目的所在,而这一市场也恰恰是 MCU 厂商的切入 AI 市场的关键点。以前很多终端产品采用的主控器就是 MCU,当这些设备需要增加 AI 功能时,设备厂商首先想到的就是升级,而不是用 AI 边缘芯片替换原有的 MCU 产品,升级的优势很明显,对于设计工程师来说,产品升级比重现设计更简单,对于设备厂商来说,在原来的 MCU 上进行升级,产品稳定性更高,风险更低。

 

在 2019 年底,IC Insights 发布预测性研究报告,2019 年全球 MCU 市场规模将达 204 亿美元、出货量达到 342 亿颗,不过平均售价(ASP)将持续下降。在全球电子产品智能化的进程中,AI 芯片创业公司看到了电子产品更新换代的商机,但是传统 MCU 厂商也不会对新的市场需求熟视无睹,Arm 推出 AI 处理器无疑在架构上给 MCU 厂商提供了更强大的支持。

 

存量市场的AI改造势在必行

对现有的电子设备增加 AI 功能是否可行?这估计是应用市场最关心的问题,比如电梯,出于成本的考虑,物业管理公司更愿意进行智能改造,而不是更换新的设备。当前的肺炎疫情让电梯成为一个重要的防控区域,由此还激发出人们想出各种按电梯“妙招”,其实如果将电梯改为语音控制,就能有效避免交叉感染。前几天,苏州思必驰展示了基于其智能电梯离线语音方案改造的语音控制电梯,其工作人员介绍,“这套解决方案内置思必驰高性能语音算法,采用线性双麦降噪,满足小而密闭空间下的复杂场景需求;支持远场唤醒、强鲁棒识别,支持普通话、带方言的普通话识别,以及方言定制;提供高自然度的多种合成音选择,支持小数据快速定制 TTS。在硬件方面,采用了思必驰的 TH1520 芯片,进行电梯改装时,直接加外挂模块就可以完成。”

 

MCU 是否可以切入 AI 应用?嵌入式资深工程师马晓东(化名)的看法是,“MCU 切入人工智能市场是必然趋势,而且对于后面进入 AI 市场的人是很好的机会,可以使设备体积缩小,部署更加容易。比如我们的电梯系统,现在通过一颗 RK3288 统计乘坐人的数量、年龄、性别,是否有人员跌倒等状态信息,目前的识别方式是将图片发送到服务器识别,如果可以在本地做 AI 处理,我们就不用部署大型服务器进行远程图形识别了。”

 

业界资深工程师金鸿(化名)分析,“MCU 切入 AI 市场只能做通用 AI,而这又不是 MCU 厂商设计人员所擅长的,一般公司技术积累还有欠缺,因此只能从外面寻找人才,估计产品定义会出现问题。MCU 厂商做 AI 无非有三条路:第一,MCU+专用 AI ASIC(从 AI 芯片购买 IP);第二,基于 DSP 和 Arm Cortex-M55,只是在流行的 AI 框架做适配;第三,MCU+某一专用 AI 应用(比如:语音唤醒,阵列等)+WiFi。AIoT 芯片厂商应该是第一批尝鲜者,比如国内的恒玄、csr,会尝试基于 Cortex-M55 架构设计 MCU,这与他们的 AUD+BLE, AUD+wifi 产品线很匹配,这颗内核做音频性能应该足够。”

 

在嵌入式联谊会秘书长何晓庆老师看来,“一般规律是,专用芯片在逐步演进,慢慢被通用芯片替代,因为随着市场普及,专用芯片的缺点就会放大,通用芯片的优势也会逐渐彰显。现在 AI 芯片距离大规模应用还很远。”

 

从市场应用实例可以看出,嵌入式设备存量市场进行 AI 升级是刚需,这对于 MCU 厂商来说是一个潜在的市场机会,尤其是针对智能语音识别应用,但是还在起步阶段,短期内无法实现大规模应用。