Arm 在服务器市场的进展并非一帆风顺,在其性能优势并不十分显著且功耗问题并不受重视的时期,Arm 进军服务器一度引发业界质疑。
但是今非昔比,能耗首先已经成为全球关注的重大问题之一,其次,基于 Arm 架构的处理器性能提升显著。几个月前登顶全球超算榜单的基于 Arm 架构的“富岳(Fugaku)”,不仅是全球最快的超级计算机,也是 Green500 名单中全球最高效率的超级计算机。Arm 在性能、功耗、生态等优势愈发明显的基础之上,也更有信心在数据中心和即将爆发的边缘市场抢占新机遇。
日前,Arm 宣布面向云到边缘基础设施产品 Neoverse 新增两个全新的平台:Neoverse V1、第二代的 N 系列平台 Neoverse N2,这是继 2018 年 Arm 首次推出 Neoverse 后的再度进阶。V1 和 N2 主要面向 7nm/5nm 工艺设计,支持可伸缩矢量扩展(SVE),相较于 Neoverse N1,这两款新平台的性能分别高出 50%和 40%。
异构计算、定制化带来新机遇
据 Arm 基础设施事业部高级副总裁兼总经理 Chris Bergey 介绍,Arm 处理器核在性能方面的优势,已经获得了国际上大型互联网公司的认可。前 7 大互联网公司中,有 4 家企业公开宣布采用 Arm 技术,包括腾讯宣布 TARS 微服务开发框架已成功移植至 Arm CPU 架构、百度在其数据中心采用基于 Arm 架构的智能计算、亚马逊 AWS 云在其云服务器上进行基于 Arm 架构的自研项目开发等。
Neoverse 标志着 Arm 过去十年不断积淀、打造一个更高效的基础设施平台的目标得以实现。根据这一计算平台的路线规划,预计以每年增长 30%的平台性能为指标,持续优化到 2021 年。Arm 如何保证增速不放缓?Chris Bergey 表示,这与 Arm 工程团队的努力和投入密不可分,其次也与软件生态的逐渐成熟有很大关系,例如很多云原生的软件现在可以比较无缝地运行在 Arm 架构上。
异构计算的推动力也不容小觑。除了很多异构计算的产品与方案均基于 Arm 架构外,在数据中心里,无论是存储还是数据加速,整体趋势是分布式的,对性能和功耗都提出了严苛的要求,因此无论是基于何种硬件架构(FPGA、GPU、TPU)的加速器,数据的移动是必不可少的。Chris Bergey 表示,“对 Arm 来说,如何提供紧耦合或是定制化的能力,甚至是通过多核封装或多芯片组装技术,将来自生态系统、IP 技术与云厂商的需求与技术整合在一起,是很大的机遇。
针对中国市场,他认为,也会有越来越多的互联网厂商基于 Arm 架构自研云服务器芯片。Arm 可以通过 Neoverse N1、V1 来提供支持。
在云、边的突破性进展
Neoverse V1 作为 V 系列的第一个平台,与 N1 相比,其单线程性能可提升超过 50%,对于 CPU 性能与带宽更高要求的应用来说,是性能表现最佳的平台。重要的是,Neoverse V1 支持可伸缩矢量扩展(Scalable Vector Extensions, SVE),SVE 可基于未知宽度向量单元的软件编程模型,执行单指令流多数据流(SIMD)整数、bfloat16、浮点指令。SVE 可确保软件编码的可移植性与使用寿命,同时兼顾高效的执行,这将为高性能云、高性能计算与机器学习等市场带来庞大的应用潜力。
扩展性是 Arm 合作伙伴在不断发展的市场上制胜的关键。为了满足市场的需求,Neoverse N2 被定位为可提供更高性能计算的解决方案,用来满足横向扩展的性能需求,其用例可横跨云、智能网卡(SmartNICs)、企业网络到功耗受限的边缘设备。相比于 Neoverse N1,Neoverse N2 在保持相同水平的功率和面积效率之余,单线程性能提升了 40%。
持续扩展软件生态和组件支持
Chris Bergey 强调了未来发展软件生态的重要性,Arm 通常将软件分为两种类型:一是云原生软件,二是传统企业级软件。云原生软件是 Arm 一直以来相当重视的领域,拥有最大的持续集成 / 持续交付(CI/CD)平台,并在大多数编程语言的生态环境中扮演着核心角色。而 Project Cassini 项目的推出,也是因为看到云原生技术在边缘计算和 5G 领域变得越来越重要,Arm 希望能够为软件开发者提供流畅的体验,通过标准、平台安全性与参考实施,让行业伙伴对在 Arm 平台上部署“装机即用”的软件充满信心。
在传统企业软件领域,“软件即服务”(SaaS)正成为显著趋势。由于在 Arm 架构之上能够创造非常有利的软件即服务产品,因此很多独立软件开发商(ISV)开始对 Arm 表现出浓厚的兴趣,在中国市场尤其显著。目前,包括 Xen、KVM、Docker 容器以及越来越多的 Kubernetes 在内的基础软件都已经陆续宣布支持 Arm 架构,许多初期由 Arm 推动的开源项目正在变得自主运转。
此外还有其他必要的组件支持,例如芯片级的接口,Arm 在 CCIX 与 CXL 的投资可以确保其生态系统得以快速且高效地推出相关的技术。Arm 现在不但提供领先的处理器核,还为合作伙伴提供可扩展性的交换网,用以支持大量的处理器核。这些投入都能够带来系统层级解决方案的设计机会。