自2011年发表Armv8架构后,睽违10年,安谋(Arm)推出Armv9架构,以满足客户对安全性、人工智慧(AI)与各种特殊运算任务的需求。Armv9建立在Armv8的基础上,所有针对Armv8架构所编写的软件,都可以直接移植到Armv9,但如果要使用Armv9所具备的各种先进安全功能,除了硬件必须更新外,软件亦需进行一定程度的修改。但有鉴于骇客攻击事件层出不穷,业界人士预估,为了提高系统安全性,即便需要投入对应的研发资源进行升级,安谋生态系统中的软硬件业者,都将对导入Armv9架构抱持相当积极的态度。

 

安谋执行长Simon Segars表示,展望由AI定义的未来,必须巩固尖端运算的基础,以因应即将到来的独特挑战。Armv9将成为接下来3,000亿颗基于Arm架构晶片的先驱。这些晶片将由来自对于普遍、特定、安全与强大处理力的需求所驱动,同时建构在通用运算的经济效益、设计自由度与容易取用等特性上。

 

基于Arm架构的晶片出货量持续攀升,过去五年已出货超过1,000亿颗基于Arm架构的晶片。以此推估,未来的数位资料在其生命週期中,都必然会在某个阶段使用Arm的技术来处理。也因为Arm架构将无所不在,使Arm有更大的责任,必须推出更安全、更高效能的Armv9架构。随著AI、物联网与5G在全球的强劲发展,Armv9将加速从通用运算转为特定运算的应用。

 

Armv9架构大幅强化安全功能

为了面对当今最大的科技挑战-亦即保护全世界的数据,Armv9架构蓝图中,包含了Arm机密运算架构(CCA)。机密运算是在硬件架构的安全环境中执行运算,以协助保护部份使用中的程式码与数据不被存取或修改,甚至是具有特殊权限的软件,例如作业系统(OS),也无法像现在这般,任意存取被机密领域保护的资料或程式码。

 

 

Armv9架构将支援机密运算(CCA),为程式码跟资料提供更严密的保护。

 

Arm CCA将导入动态设置机密领域的概念,让所有应用程式皆能在非安全与安全世界中使用。例如,在商业应用裡,机密领域可以在系统中保护使用中、閒置与传输中的具商业敏感性的数据与程式码。Pulse近期的调查显示,超过90%的企业决策者表示,若企业具备机密运算,将能降低在安全方面投入的成本,转而大幅提高对工程创新研发的资源。

 

微软(Microsoft) Azure Edge与平台事业部企业副总裁暨技术长Henry Sanders表示,我们无法以一体适用的解决方案,应对从终端到云端越来越複杂的使用场景。因此,异质运算变得越来越无所不在,而它也需要硬件与软件开发人员间更大的综效。安谋与微软密切合作开发出来的Armv9机密运算功能,即是一个很好的硬件与软件展现综效的实例。安谋具有独特的地位,能在生态系核心加速异质运算,并在驱动数十亿个装置的架构平台上促进开放创新。

 

除了CCA之外,由于对记忆体的攻击层出不穷,Armv9也对记忆体上的资料进行更周全的防护。

 

藉由与Google合作,Armv9将具有记忆体标签(Memory Tagging Extensions, MTE)延伸指令功能,每个记忆体位址都将带有标签跟对应的密钥,必须具有正确的密钥,才能读取该位址上储存的资料,大幅提高骇客对记忆体进行攻击的难度。目前在Android 11与OpenSUSE上已搭载了MTE,Armv9架构则会全面支援此一延伸指令。

 

无所不在的AI需要对应及可扩充的解决方案

AI工作负载具有无所不在且种类繁多的特性,因此需要更多元与特定的解决方案。到2020年代中期,全球预计将有超过80亿个正在使用且具备AI功能的语音助理装置,且90%或更多的终端装置应用将包含AI元素以及基于AI的介面,如视觉或语音。

 

为了对应这个需求,Arm与富士通合作并研发可扩展的向量延伸指令集(SVE)技术,该技术成为全球速度最快的超级电脑富岳的核心。在SVE的基础上,Armv9将包含这些延伸指令集的进阶版本SVE2,以便在广泛的应用情境中,实现强化机器学习(ML)与数位讯号处理(DSP)能力。

 

SVE2可强化在CPU上运行的5G系统、虚拟与扩增实境,与机器学习等工作负载的处理能力,例如影像处理与智慧家庭应用。在未来几年内,Arm将大幅强化CPU内部的矩阵乘法能力,进一步扩展Arm的AI技术能力,同时持续推动在Mali GPU与Ethos NPU的AI创新。

 

透过系统设计让效能极大化

在过去五年间,Arm架构每年为CPU提供的效能提升都超越业界平均速度。Arm也将在Armv9世代维持这样的速率,预计未来两代的行动与基础架构CPU,都将有超过30% 的效能提升。

 

然而,随著产业从通用运算朝向无所不在的特定处理发展,每年两位数的CPU效能提升已经不够。除了强化特定处理能力,Arm的全面运算设计方法藉由聚焦系统层级的硬件与软件最佳化以及应用场景效能的提升,加速整体运算效能。

 

藉由将全面运算的设计原理应用到针对汽车、终端、基础架构与物联网解决方案的所有IP产品组合,Armv9系统层级技术将横跨所有IP解决方案,并最佳化个别IP的表现。此外,Arm也正在开发多项技术,以提升频率、频宽、快取大小并降低记忆体延迟,极大化基于Armv9架构的CPU效能。

 

联发科力挺 Armv9晶片年底前发表

在Armv9架构发表会上,联发科技术长周渔君亦透过影片为安谋站台。周渔君指出,联发科与Arm在行动装置、笔电到数位电视等多项产品方面,已密切合作多年。Arm 架构的可扩充性、效能表现以及设计创新,都是协助联发科扩展产品系列的关键。Armv9架构的推出,将在次世代天玑 5G 系列产品的性能表现与使用者体验的提升上,扮演重要角色。联发科预估,该公司第一款基于Armv9架构的晶片产品,将在2021年底前发表。