数据大爆发的时代,大部分芯片企业都在欢呼算力黄金时代的到来。但对于Intel来说则是一个巨大的时代命题:如何在不再“黄金”的黄金时代继续稳坐C位?

 

数据中心是Intel的核心业务,也是最重要的增长点。眼下,Intel正在这个主战场被多路包抄。一边是奋起直追、不断蚕食份额的AMD;一边是凭借GPU不断创下营收、利润和市值高峰的英伟达;旁路还有渐成气候的FPGA、AI加速芯片分队,高举着“帮助CPU卸载计算任务”的大旗兵临城下……

 

服务器芯片仅围绕X86优化升级的黄金年代一去不复返。尽管Intel在数据中心的主导地位不会瞬间消失,但随着竞争的加剧,如果错失反击的时机和力度,失去的可能就是下一个黄金时代。

 

至强“虽迟但到”

 

继2019年推出了上一代至强可扩展处理器后,Intel在第三代至强的发布日期上一鸽再鸽。经过漫长的预热和等待后,在AMD抢先发布第三代EPYC米兰后,Intel终于在昨夜宣布推出第三代至强(Xeon)可扩展处理器,使得这个春天的服务器芯片之战更加充满看点。

 

这也意味着,Intel暌违服务器处理器一年多后,终于迎来重大更新,从产品性能、产品阵容来看,不仅是Intel当下在数据中心对抗焦虑的一剂良药,也是放眼5G、HPC、边缘计算等广阔蓝海的重要窗口。

 

第三代至强可扩展处理器最主要的亮点包括:

 

采用Intel最新的10nm工艺,单个芯片最多包含40核。与上一代20核Cascade Lake相比,IPC性能提升20%;46%的代际平均性能改进;74%的AI推理性能增加。第三代至强可扩展处理器是Intel首个主流双插槽并启用SGX软件防护扩展技术的数据中心处理器,是Intel唯一一个内置AI加速的数据中心处理器。此外,作为多代策略的延续,第三代至强内置有Intel密码操作硬件加速技术。


 

据英特尔公司副总裁兼至强处理器与存储事业部总经理Lisa Spelman介绍,在整个第三代家族中,Intel已经宣布了适用于4个和8个插槽的系统,因此截至目前可以服务1个、2个、4个、8个插槽配置,便于用户优化节点大小,实现更高的虚拟机密度,减少滞留资源,节约拥有成本。


 

应对数据中心AI负载任务的增长,第三代至强通过代际硬件平台改进、软件优化,在机器学习用例中,比如XGBoost算法、Kmeans算法等方面,实现了1.3-1.6倍的性能提升;面向深度学习应用中常见的图像识别、图像分类、语言处理等,DL Boost指令实现了1.45-1.74倍的性能提升。

 

数据中心的“性能税”也是第三代至强着力改善的方面。为了走在安全威胁前面,用户都在争先恐后地加密用户数据,有时不得不在性能和更高的安全性面前进行艰难选择,随之而来的就是解决方案成本或总体拥有成本的增加。第三代至强可扩展处理器通过内置的密码操作硬件加速,利用加密算法包括公钥对称加密、哈希法等突破,降低普遍加密对性能的影响。

 

PK AMD:莫以核数、工艺论英雄

 

第三代至强最受关注的就是与AMD米兰的对比,这款写着AMD野心的产品,基于全新Zen 3架构,内核数量最高可达64核,采用台积电7nm制程工艺,声称超越Intel目前最好的数据中心芯片。

 

第三代至强与之PK,具体表现究竟如何?Intel技术专家首先阐明一个观点:单纯的“核”数比拼不可行,虽然大多数行业标准的基准测试都是最大吞吐量,但是对于数据中心计算机架构来说,不仅需要提高吞吐量,同时也需要具备最佳的响应能力,这样才能更好地处理数据中心普遍的工作负载。为了实现这一点,处理器既需要应对传统的工作负载,也要能够应对新兴的数据工作负载,性能需要在处理器内部和外部进行良好拓展,无论是节点内部还是外部。

 

Intel官方给出了与AMD米兰在缓存时延、内存时延等方面的参数对比:

 

在包括L1、L2、L3层级的缓存时延方面,最关键的是L3层面的缓存时延。第三代至强可以直接访问这一层缓存,从而获得一致的响应时间。米兰包括8个不同的硅芯片进行计算,每个都有独立的缓存,当数据在本地缓存中,即核所在的位置旁边,响应时间会很短;但如果数据不在本地缓存,需要通过I/O请求,到另一个计算硅芯片来检索数据,再通过I/O回到发出申请的内核,因此本地缓存访问和远程访问之间响应的时间差别很大。

 

 

内存时延方面,Intel技术专家强调了最大的DIMM能力、速度能力。第三代至强有8个内存通道,可以在最高的内存频率下达到3200 DIMM性能,而米兰只有一个内存通道可以以最快的速度运行,到第二个DIMM时,速度下降会降低内存的吞吐量。

 

在DRAM时延方面,在本地插槽的情况下,从内存中获取数据最快需要多长时间?从第二个远程插槽中获取数据又需要多长时间?Intel方面强调了第三代至强组合产品的优势,硅芯片旁边就是直接内存控制器,因此本地插槽延时更短,远程插槽延时性能更优,最高可以快30%。

 

内存总能力上,Intel的持久内存可以实现每个插槽6TB内存,这一能力几乎可以让用户在尽可能靠近处理器的位置随时提取数据,做到快速访问。Intel技术专家表示,以上这些好处不一定在吞吐量上能显示出来,但实际响应时间在应用中非常关键。

 

 

在深度学习和推理性能方面,第三代至强比AMD米兰提高25倍。在20个最常见的机器学习、深度学习模型的训练和推理比较中,第三代至强性能是米兰的1.5倍,是英伟达A100 GPU的1.3倍。

 


 
面对数据中心应用将AI加速计算任务卸载到专用处理器上的趋势,Intel借第三代至强发布之际再次表明:第一,至强CPU是AI加速的绝佳选择,加速发生在CPU,可以将工作负载提升到新的水平;第二,数据中心基础架构的高利用率非常关键,决定了用户在不同类型工作负载中能够获得的容量弹性,因此在最佳TCO基础上的分布式服务最为重要,而不仅仅是在孤立的节点基准测试上做到最佳。

 


人无我有的“工具箱”策略

 

如果给数据中心用户一个必须选择第三代至强的理由,Intel方面强调的是灵活性。用Intel内部技术专家的话来说就是“工具箱”:我有一个工具箱,有各种不同类型的工具,不管需要什么,打开工具箱都可以找到最好的工具去做这个事情。我们不是只卖一个锤子,而是针对每一个客户需要的工作负载提供给他最好的工具,让他真正解决问题。

 

据Intel官方数据,自2017年推出第一款至强可扩展处理器以来,已经向全球客户交付了超过5000万颗至强处理器,支持着全世界的数据中心;部署了超过10亿个至强核心,为云提供动力;超过800个云服务提供商部署了基于至强可扩展处理器的服务器;超过1000个客户进行了TOC认证;Intel将用户每台虚拟机的基础设施成本降低25%,而性能保持不变,已经将超过80%的TOC转化为已有实际收益的部署。

 

围绕至强,Intel建立了广阔的生态系统,CPU虽然是客户购买决策的关键部分,但不是唯一因素,Intel对至强的定位并不是服务器产品,而是覆盖边缘到云的数据中心产品,专注于业务应用程序的优化和交付可靠的性能。

 

伴随着第三代至强的推出,Intel将继续通过整套系统级方案的优势来占领市场。具体产品组合包括:傲腾持久内存200系列,这是下一代持久内存模块,内存带宽增加32%,每个插槽内存容量最高可以达到6TB;最新的傲腾固态盘是迄今为止最快的数据中心固态盘,IOPS提升4倍,可满足高速网络的需求,同时TOS最高提升6倍,可以满足最严苛的SLA要求,相较于NAND固态盘,延迟降低13倍;NAND 固态盘D5-P5316,耐久性是QLC固态盘的5倍,在密集、大容量、高质量的工作负载方面尤为重要;以太网适配器800系列,网络数据吞吐量最高可达200GB/s,适合高性能 vRAN、NFV转发面、存储、高性能计算、云和CDN等应用场景,能够为虚拟机密度提供最多两倍的资源;此外,还有采用Intel 10nm SuperFin制程技术的Agilex FPGA,搭配Quartus Prime软件,能够实现高于7nm竞品2倍的每瓦性能。

 

不过,除了all-in组合继续雄霸市场的决心,第三代至强也是Intel实现平稳过渡的一代产品,体现着并不激进的平衡策略。在总线和内存方面,它支持PCIe 4.0 64通道、DDR4,而不是更为先进的PCIe 5.0、DDR5内存。对此,Intel市场营销集团副总裁、中国区数据中心销售总经理陈葆立表示,整个产品的迭代做好平衡非常重要,不管是核数、还是不同工作负载的加速指令和配套产品。目前采用PCIe 4.0 64个通道,已经可以显著提高带宽和性能。随着分布式计算、微服务在大规模数据中心的应用,I/O的时延和一致性对于大规模服务的实际交付非常关键。Intel通过对这些I/O流、在插槽中的处理情况,以及与CPU上其余服务交互方式的改进,从而保证能够提供最佳的规模系统性能,满足遍布大量节点和整个数据中心的需求。

 

写在最后


第三代至强可扩展处理器的推出,不仅仅是发布了一个CPU。纵观整个Intel,似乎有取之不尽的宝藏,不论是XPU+one API战略,还是完整的解决方案组合。就连一直被外界认为是累赘的IDM模式,却在产能短缺的时候成了不得不提的优势。正当人们感慨AMD+台积电模式会给Intel一记重击的时候,新任CEO帕特·基辛格(Pat Gelsinger)提出了IDM 2.0愿景,宣布将在生产制造方面继续扩张。

 

这些能力在第三代至强产品面世之时已经初见端倪。在公开宣布产品之前,Intel其实已在去年年底启动生产,并在今年第一季度加大了生产力度,目前出货已经超过20万,Intel承诺将会利用自身生产优势最大限度满足市场对第三代产品的需求。显然,Intel已经形成了对第三代至强可扩展处理器进行批量生产与交付的生态系统和供应链。

 

Lisa Spelman在采访中也强调,从平台到边缘到云, Intel已经建立了一个价值超过10亿美元的业务,并且这个业务还在继续增长。通过整合更多产品组合,Intel能够满足用户多样化的需求,这是单一芯片竞争对手无法比拟的优势,能够帮助用户加速面市时间,简化从边缘到云基础设施的部署。

 

不过不管怎样,时代的列车已轰鸣转向。未来属于异构,这是Intel必须面对的新命题,全面高筑的技术和生态体系就是Intel在下一个黄金时代应对竞争最大的张力。