“对于未来基础设施的多样化要求,传统上放之四海而皆准的解决方案已经不再适用。越来越多样化的工作负载、摩尔定律的减缓,以及符合数据中心占地面积和功率密度的要求,使得云服务提供商和超大型互联网公司正在推动的创新也达到了一个前所未有的水平。这些都在驱动整个数据中心的优化,并且逐渐从上层应用迁移到整机,扩展到服务器处理器”, Arm基础设施事业部全球高级总监邹挺(Frank Zou)日前在接受<与非网>等媒体采访时表示。

 

服务器芯片市场由此在发生着深刻的变革。一方面,超大型互联网服务商开始定制服务器芯片,以满足特殊应用场景需求。另一方面,大量的企业用户对于标准化服务器芯片所能带来的高性价比、优异的TCO表现,有着浓烈的兴趣。而这些,可能会给Arm服务器芯片厂商带来广阔的市场前景。

 

去年9月,Arm发布了Neoverse V1和N2,可以说是Arm Neoverse面向基础设施市场的全面启动。今年,Arm进一步公开了Arm Neoverse V1和N2 平台的产品细节。这两个平台的设计旨在解决当前正在运行的各种工作负载和应用问题,并分别带来 50%和40%的性能提升。此外,Arm也同时发布了CMN-700,作为构建基于Neoverse V1和 N2 平台高性能SoC的关键部件。可以说,针对基础设施应用,Arm着力在满足性能、功耗等关键需求。


基础设施领域,Arm的一盘大棋

 

Arm Neoverse平台产品目前包括三个系列,横跨从高吞吐量计算到功率与尺寸受限的边缘和5G场景,面向不同市场应用需求,提供可扩展性。

 

  • V系列平台:强调以性能为优先的新型计算系列,目前以Neoverse V1平台为代表,在高性能计算、机器学习等应用中有较大优势。
  • N系列平台:以PPA为考量重点,追求PPA的平衡设计,目前该系列的产品有Neoverse N1与N2平台,适用于通用服务器的 CPU 芯片、智能网卡应用芯片,5G基站的网络设备等。值得一提的是,Neoverse N2平台是第一个基于Armv9架构的平台,在安全性、能耗以及性能方面都有全面的提升。
  • E系列平台:主要关注点是吞吐量效率,在功耗和面积的缩减上进行了优化,对于网络流量和数据应用程序非常有效,目前以Neoverse E1平台为代表,对于网络数据层处理器、低功耗网关的 5G 部署等应用,优势明显。

 

 

而不论是面向哪类应用,一个完整的产业生态是关键,这也是Arm一直以来的宝贵经验。自推出Neoverse平台产品路线图以来,基于生态的合作一直是Arm持续推进的重点。

 

Neoverse如何吸引众多硬件和软件合作伙伴加入?邹挺表示,生态系统的共建、共享与共赢一直是 Arm运营的核心信念。Arm Neoverse 生态系统自 2017 年推出以来持续保持稳步增长,以基础设施市场的四个细分市场为目标: 大规模公有云的互联网领域、高性能计算、5G/网络领域和边缘设备网关,生态建设也是围绕这四个细分市场来进行重点投入。

 

在云服务领域方面,AWS、Oracle、腾讯、百度等都选择了Arm架构,在应用软件、操作系统、中间件等方面不断进行设计及优化;HPC方面,富岳的超级计算机再度在性能测试上取得成功,力证了Arm在该领域所能达到的性能要求;5G 方面,联想、日海、诺基亚、三星等采用了Arm技术;边缘计算方面,包括恩智浦、Marvell、NVIDIA等,都是Arm的合作伙伴。


DPU赛道头部芯片已开局

 

当前,DPU已经成为一个热门赛道,基于Arm内核的DPU芯片,也越来越多地引起业界关注。Marvell 已经率先推出采用Neoverse N2 的 OCTEON 10 系列DPU,NVIDIA在 BlueField-3 DPU中宣布采用Arm内核,甚至在英特尔最新推出的IPU产品Mount Evans中,也非常罕见地采用了Neoverse N1内核。如何看待这些头部厂商在DPU领域的投入,以及Arm在这一领域的发展前景?

 

邹挺表示,从 DPU的实现来看,DPU连接到主机系统,并通过PCI-Express插槽接收电源,这会限制DPU可用的能耗,出于这个原因,再加上DPU支持专用的工作负载加速器和数据包处理功能,因此DPU处理器能否提供出色的每瓦性能至关重要。而Neoverse N 系列之所以成为越来越多DPU核心的选择,正是因为它出色的每瓦性能表现。例如Marvell的 OCTEON 10,与前几代产品相比,能提供3倍的性能提升和50%的功耗优化,优势较为显著。

 

而不论是国内的互联网巨头,还是全球的头部互联网企业,在逐步部署和适配标准化 DPU 产品的同时,大部分也在探索自研或外包,来开发适合自己业务特殊需求的定制化 DPU 产品。

 

在这一方向上,邹挺认为ASIC SoC DPU 会是最终产品的普遍形态,虽然中间也会有FPGA 作为过渡期的解决方案。他表示,基于对能耗和性能要求,Neoverse 平台、特别是 N 系列平台,将成为ASIC SoC DPU方案的最佳选择。


在中国市场重点关注两大垂直领域

 

邹挺强调,以中国市场来看,特别是看到二线互联网和企业市场对于标准化 Arm 服务器需求的高速增长,为独立Arm服务器芯片厂商带来了机遇,Arm正在加强与这些企业的技术交流和生态对接。

 

Arm 针对中国基础设施市场的重点领域有哪些?相较于海外市场,市场战略有何不同?

 

邹挺表示,首先在中国市场重点关注的领域是云数据中心/超大型互联网领域,和5G网络/电信市场这两个垂直领域。

 

其次,对比海外市场的半导体芯片产业已经进入产业成熟期和供应链厂商的版图稳定期,中国目前是自发增长且高速成长的市场。在过去 18 个月,也看到很多的新兴半导体企业在不同赛道来寻求落地实现的机会。半导体芯片的国产化浪潮中,产生了众多的芯片赛道,例如CPU、DPU、GPU 等领域,都涌现出了大量具有发展潜力的创业公司,而这也是Arm提供专业IP,助力国内产业升级的一个千载难逢的机会,Arm也愿意与国内芯片厂商进行技术交流、生态对接。

 

和传统服务器相比,Arm服务器更大的优势主要体现在训练还是推理方面?邹挺表示,Neoverse 内核支持新的数学功能和数据格式,这些都可以作为提高机器学习的推理性能。相较于传统的 CPU,这些功能可以加速推理吞吐量达4倍。此外,虽然机器学习训练方面,通常由GPU、NPU执行大部分处理任务,不过CMN-700 互连技术中支持 CXL,可以更好地实现GPU、NPU与CPU的连接,提供更低时延,更高吞吐量的连接。也就是说,CMN-700 赋能了多芯片、内存扩展和加速器的下一代应用场景,使解决方案具备总线和高核数的可扩展性特色,为紧密耦合的异构计算提供更大的灵活性。


Arm 在软件开发的持续投入

 

据了解,Arm有45%的工程师在支持软件方面的工程开发。扩展Arm生态系统的广度必须大规模地投入研发。在Armv8时代的十年,光是Arm软件开发人员所投入的研发时间,就超过了 1,000 万个人时。

 

而预计Armv9时代的十年,Arm软件开发人员的投入时间大概率会超过3,000万个人时。因为我们已进入万物计算的时代 ,把来自Arm生态系统的研发投入也加进去,软件开发人员投入时间将会超过15亿个人时。

 

而在基础设施领域,一个正在发生的变化是,开发者在迅速采用云原生软件。通过过去十年的努力,Arm现在拥有大量的OSS 项目,ISV也已经支持 Arm 64 位架构。在 Docker Hub 上为 Arm 编写的容器镜像数量超过 10万。同时,在 Arm 硬件上进行 CI/CD 构建的时间已经多达每个月超过100万分钟。企业级云原生软件的支持方面,红帽近日也宣布其Openshift on Arm开发者预览版也将在中国落地,为国内开发者带来全球一致的开发体验。Arm希望通过积极参与相关的开源组织、社区或是TARS /OpenAnolis项目,力促国产云原生软件能快速地运行在Arm架构上。