人工智能(AI)发展愈加快速,并开始大举进军终端装置,运算分析已开始从云端转向终端节点,边缘运算发展可说是目前半导体产业热门议题,而 2018 台北国际电脑展(Computex 2018)也成为各领域业者(如 IP、芯片、储存)火力展示的绝佳场合,纷纷于展会期间发布新的解决方案或市场布局规划。

 

抢攻边缘运算市场 Arm 动作频频


Arm IP 产品事业群总裁 Rene Haas(图 1)表示,随着物联网的蓬勃发展,Arm 预测至 2035 年全球将会有超过 1 兆台的联网装置,运用于医疗、汽车、灯具及道路等范畴,而联网装置数量的大幅成长也将带领终端及云端运算的持续发展。智能运算将持续推动物联网崭新时代,带领 AI 变革,促使物联网智能运算无所不在。

 

 

图 1 Arm IP 产品事业群总裁 Rene Haas 表示,物联网蓬勃发展将使联网装置快速增加,智能运算未来将无所不在。

 

因应此一趋势,且为整合生态系统的 AI/ 机器学习(ML)应用、演算与框架,并结合软件优化与硬件 IP 产品,让各式装置及平台都能支援最常使用的机器学习框架,Arm 近期宣布推出三款全新 IP 产品,分别为 Cortex-A76 CPU、Mali-G76 GPU,以及 Mali-V76 VPU,以提升游戏与 AR/VR 体验,AI 和机器学习能力。透过这三款新产品,Arm 将持续强化该公司于行动领域的竞争优势,也再度增强了智能手机、平板电脑、PC 等行动终端装置的运算效能。

 

Arm 副总裁暨客户事业部总经理 Nandan Nayampally(图 2)表示,未来 5G 将推动整个行动产业创新,即将到来的 5G 联网应用,包含 VR、AI 或是手机游戏等将会带动更多运算量成长,未来将会有更多不同运算需求产生。

 

 

图 2 Arm 副总裁暨客户事业部总经理 Nandan Nayampally 指出,5G 加 AI 将推动整个行动产业创新,Arm 为此推出全新 IP 产品因应市场需求。

 

Nayampally 进一步指出,游戏也是推动行动装置运算持续攀升的关键因素之一。游戏产业已成目前全球营收规模最大的市场之一,预计在 2018 年可达到 1,379 亿美元的产值,这也驱动了消费者对于运算效能的需求。

 

据悉,Cortex-A76 是基于 Arm 旗下的 DynamIQ 技术打造,和去年所发布的 Cortex-A75 相比,提升了 35%的效能与 40%的效率;可为终端装置上的 AI/ML 提供 4 倍的运算效能,于 PC 和智能手机上实现快速且安全的体验。

 

Mali-G76 则比前一代的 Mali-G72 GPU 提升 30%运算效能,以及增加了 30%的效能密度,不仅可满足消费者随时游玩高阶游戏的需求,也为开发人员提供更多的效能空间,使他们能编写更多新的应用程式,为行动应用带来更多高阶游戏,或是将 AR/VR 整合至生活当中。

 

最后,随着 UHD 8K 需求逐渐攀升,为确保 IP 能支援智能手机和其他装置编码解码运算,Arm 便推出 Mali-V76,可支援高达 60fps 的 8K 解析度或四部 60fps 的 4K 串流影片,消费者能同时串流四部 4K 解析度的电影、在视频会议中录制影片,或者以 4K 观看四场比赛;或在较低解析度的状况下,仍能呈现高解析度画质(Full HD),并能支援多达 16 部串流影片组成 4×4 的电视墙。

 

Project Trillium 亮相加速建构 ML 生态系

与此同时,为提升终端装置机器学习效能,Arm 也于 2018 年初发表 Project Trillium 平台,包含全新机器学习处理器(ML Processor)、物件侦测处理器(Objects Processor),以及 Arm 神经网路软件( Arm NN)。相较于独立 CPU、GPU 与加速器,Project Trillium 平台效能更远远超越传统 DSP 的可编程逻辑。

 

Arm 副总裁、院士暨机器学习事业群总经理 Jem Davies(图 3)指出,边缘运算发展潜力十分庞大,目前市面上的确有许多独立的解决方案,像是 ASIC 加速器、CPU/GPU 等。终端业者当然可以选择自己想要的方案,不过缺点在于须花费时间自行进行硬件与软件(TensorFlow、Caffe)的整合。

 

 

图 3 Arm 副总裁、院士暨机器学习事业群总经理 Jem Davies 认为,Project Trillium 可望为终端装置打造完整的机器学习生态系。

 

Davies 说明,Project Trillium 的优势在于,是以平台的架构呈现,硬件方面不仅有 ML Processor 和 Objects Processor 可供选择,同时也能透过 Arm NN 软件,协助使用者简化 TensorFlow、Caffe 与 Android NN 等神经网路框架和 Arm Cortex CPU、Arm Mali GPU 与机器学习处理器之间的连结整合。

 

Davies 进一步指出,软件整合是发展机器学习其中一个关键要素,许多加速器业者或许有办法提供相关硬件处理器(CPU、GPU),但却少有资源可以提供一个完善的平台架构,协助客户进行软硬件整合或是提升 ML 模型运算,而 Project Trillium 包含全新的 Arm IP 处理器及神经网路软件,从硬件和软件面都能满足现今市场需求,而这种方式也有助于 Arm 建构完善的边缘运算生态系。

 

另外,Davies 也观察到,MCU 对机器学习的需求也十分强劲。他透露,在 Project Trillium 上线,Arm NN 软件开发套件开放用户下载的第一天,就有超过 5,000 名用户开始使用 CMSIS NN,尝试以 Cortex-M 执行机器学习算法。

 

Davies 说,这个结果其实出乎 Arm 的预料,也显示 MCU 用户群对机器学习的需求跟兴趣,是不容忽视的。这也促使 Arm 决定在未来推出的新版 Cortex-M 核心中,进一步强化这类核心执行 ML 演算法的效率。

 

CMSIS NN 是 Arm 神经网路软件开发套件 Arm NN SDK 下的一个运算函式库(Compute Library),可以提升 Cortex-M 执行机器学习算法的效率。即便是现有的 Cortex-M 核心,在 CMSIS NN 的帮助下,也可以执行一些很简单的机器学习推论,例如判读感测器输出资料所代表的意义。当然,由于 MCU 的运算效能跟记忆体空间都不是很充裕,因此不可能执行非常复杂机器学习推论,但如果是对单一感测器节点输出的资料做简单判读,还是有机会实现的。

 

Davies 指出,MCU 如果无法支援某些基本的 ML 算法,AI 应用无所不在的未来是难以实现的。目前透过云端资料中心提供的人工智能应用服务,其实有很明显的应用局限,只有把 AI 不断往边缘推进,才能让 AI 应用更加普及。而为了让 MCU 能更有效率地执行 ML 演算法,在 Arm 未来的产品发展路线图里面,Cortex-M 执行 ML 的效率将会进一步提升。

边缘运算走入自动驾驶高效能处理器不可或缺

另一方面,汽车产业未来也将是边缘运算的重点应用领域之一。根据 Arm 预测,至 2020 年平均一台汽车中将会嵌入多达 200 多个感测器,并经由 100 多个发动机控制器(ECU)或微控制器(MCU)处理,而如何快速处理如此庞大的数据、即时做出回应并同时维持系统的稳定性与安全性,打造符合使用者需求的自动驾驶车,将成为未来汽车电子市场的一大挑战。

 

对此,Arm 副总裁暨嵌入式及车用事业部总经理 John Ronco(图 4)指出,边缘运算兴起,使得终端装置不用再回传大量资料到云端处理,但这也代表一般的 CPU 或机器学习芯片需要更高的处理效能,而这也是 Arm 推出 Project Trillium 和 Cortex-A76 的原因,而这些产品也相当适合放在汽车电子元件之中。

 

 

图 4 Arm 副总裁暨嵌入式及车用事业部总经理 John Ronco 表示,CPU、GPU 等处理器须具备更高效能才可因应自动驾驶安全需求。

 

此外,为实现自动驾驶,一辆汽车上除了雷达、光达外,往往也会搭载视觉感测器,也因此需要更高的 GPU 因应庞大的影像运算。

 

Ronco 表示,自动驾驶的视觉运算需求,和一般 IP 网路摄影机差别在于,IP 网路摄影机大多是单一的镜头,且不常移动,通常是安置在屋内 / 外某个角落监看。但对汽车而言,会须要搭载数个摄影镜头,侦测路况和环境,所接收的影像资讯十分庞大,且由于汽车一直在移动,周遭景物也会跟着不停变化,这会使得运算更加复杂,因此便需要完善的解决方案。

 

Ronco 透露,像是 Project Trillium 内的物件侦测处理器主要是用于 IP 网路摄影机,而要满足汽车视觉运算需求,则是须靠如 Mali-G76 这类的高效 GPU,具备更高的运算效能,才能因应汽车行驶时快速的环境变化,避免事故发生。

 

总而言之,AI 时代为各项应用领域带来新商机,而边缘运算也势将会走入汽车产业当中,但若要将边缘运算建构于汽车中,必须嵌入更高阶的技术才能达到更优异的性能表现,使汽车能够更智能、安全、有效率。

 

带动储存需求 WDC 具一条龙生产优势

边缘运算兴起,不仅促使处理器效能须跟着增加,就连储存需求也跟着攀升,储存业者因而加速产品布局脚步。Western Digital 嵌入式应用解决方案事业部副总裁 Christopher Bergey(图 5)指出,边缘运算、机器学习等技术,皆让储存和运算变得相当复杂。

 

 

图 5 Western Digital 嵌入式应用解决方案事业部副总裁 Christopher Bergey 表示,因应边缘运算市场,该公司一条龙的生产模式为市场竞争优势。

 

Bergey 进一步说明,边缘运算会随着不同的应用情境,对储存产品有不同要求,像是在汽车上特别重视温度、可靠性,在近年来又添加了成本和稳定供货 5 年的考量因素;另外在行动装置应用上,以智能手机为例,像是现在消费者对拍照越来越要求,照片的画素提高,也连带使得手机储存容量须跟着变大,边缘储存的需求将跟着变大,因此相关的嵌入式快闪记忆体(EFD)产品性能也随之提升。

 

因应此一趋势,像是 Western Digital 便推出新款 iNAND 产品系列 --iNAND8521/iNAND7550,采用该公司 64 层 3D NAND 技术以及先进的 UFS 与 e.MMC 介面,提供较佳的数据效能与庞大的储存容量。用于智能型手机与轻薄运算装置时,这两款产品能加速实现以数据为中心的各式应用,包括扩增实境(AR)、高解析视讯的撷取、社群媒体体验,以及近期崛起的 AI 与物联网边缘体验。

 

Bergey 透露,未来行动装置的发展趋势无庸置疑会朝更高性能迈进,因为 5G 世代到来后,传输数据越来越快,创新应用会愈来愈多,加上 AI 兴起,两者若相结合后,对工作负载的要求也会随之提升,储存容量势将会因而大增。该公司也会持续跟手机业者密切合作,好针对需求提供合适的产品。

 

Bergey 也指出,因应边缘运算发展,该公司其实具备很好的战略优势。原因在于,WDC 具备完整的产品线(从低阶产品到高性能产品),另外,WDC 是采用一条龙的生产策略,从晶圆、控制器、韧体和软件等,都是自行负责,因此可以快速的针对市场变化推出产品,或是满足设备商客制化需求,这是 WDC 在竞争激烈的边缘运算市场中所拥有的优势。

 

NXP 携手合作伙伴加速开发安全边缘方案

至于 NXP,则是从安全着手,携手生态系合作伙伴,如新汉、IMAGO、智邦科技、神准科技等,共同投入边缘运算安全基础架构的部署工作,支援在边缘进行连接的新兴 AI 和机器学习,以及部署于云端的安全边缘处理。

 

协力合作的系统供应商将以 NXP 的 Layerscape 与 i.MX 应用处理器系列为基础,进行产品开发,以符合需要本机处理能力与云端连线功能的各种应用上。开发出的平台提供运算能力、连线功能及储存容量之间的完善平衡,适合同时在企业及工业环境运作。

 

透过 NXP 的 EdgeScale 技术及 Docker 与 Kubernetes 的开放原始码软件,可在常见云端架构上执行各种边缘应用,包括 Amazon Web Services(AWS)、Greengrass、Google Cloud IoT、微软 Azure IoT、阿里巴巴及私有云端架构。

 

NXP 指出,EdgeScale 是包含装置和云端服务的套件,透过该产品可以简化安全运算资源在网路边缘的布建;而 NXP 将会与这些伙伴共同合作,为物联网与企业内部部署(On-Premises )的运算平台提供具扩展性、安全性,以及部署方便性,以实现安全部署与管理。

 

恩智浦数位网路事业部资深副总裁暨总经理 Tareq Bustami 表示,建立安全的边缘解决方案对于物联网及工业 4.0 的成功发展极为重要,因此,该公司致力于与众多设备制造商合作,提供容易使用且支援云端连结的安全边缘运算解决方案。透过合作,该公司将协助推出更智能、更多功能的边缘解决方案,加入可进行大规模部署及管理的强大安全功能。

 

综上所述,可看出不论是 IP 商、储存业者或是芯片供应商,皆积极布局边缘运算市场,各自开发开放平台与硬件架构,期能让 AI 走入各种终端装置中,并且建构完善的生态圈。