祸兮福所倚,福兮祸所伏,有时候,坏事情会变成可以彻底改变市场的绝佳机会。许多年后,当有人写下数据中心计算业务的历史时,他们会认为AMD利用台积电制造其第二代和第三代Epyc服务器处理器的内核是一件非常偶然的事情,但是,就是这种极具偶然性的选择让落后英特尔一个世代以上的 AMD 能够超越英特尔,并为自己建立可持续的工艺领先地位,而 AMD 与其服务器 CPU 的主要竞争对手相比还具有并行的架构优势。

 

自从 AMD 的 64 位 Opterons 集成了内存控制器、多核架构、HyperTransport 互连和其他高级功能,从而使得英特尔21世纪初的 32 位 Xeon 服务器芯片看起来可笑到荒谬以来,我们还没有看到英特尔在数据中心领域受到过如此严重的打击。直到英特尔在 2009 年通过其“Nehalem”至强 E5500 处理器克隆了 Opteron 设计的许多元素,它才能够推出一个同时在技术和经济上可以与 Opteron 替代方案竞争的服务器 CPU。

 

历史正在重演,AMD 今年 3 月份推出了其第三代 Epyc 7003 系列处理器(原代号为“Milan”)。 而英特尔的“Ice Lake”至强 SP 服务器处理器,也是其最新系列的第三代,虽然相比于它们的前辈有了重大改进,但它在单核或总插槽吞吐量性能方面,它们依然无法与 Epyc 7003 系列处理器相媲美。在价格/性能和与现有服务器设计的兼容性方面,AMD 毫无悬念地在数据中心计算领域赢得了这场与英特尔的对决。正如我们所说,与 Xeon SP 系列中的“Skylake”和“Cascade Lake”前辈相比,英特尔的 Ice Lake 芯片有了很大的改进。但 AMD 在时钟、缓存和向量单位等方面都横扫了英特尔。

 

现在,我们终于得到了相关的数据来对 AMD 第三代 Epyc 芯片与英特尔“Ice Lake”芯片进行竞争分析对比,鉴于 AMD 的全面横扫,英特尔请回了 Pat Gelsinger 尝试重振至强 SP 产品线并挽救服务器 CPU 业务也就不足为奇了。经过七年的研究、开发和产品推出,AMD 的服务器出货量份额已经突破了10% ,并且似乎准备将这一份额翻一番——甚至更多——因为该公司将拥有可持续的架构和制造工艺优势。我们对此最好的猜测是,从现在起大约一年后,AMD 将拥有 25% 的服务器出货量份额——考虑到宏观经济因素以及英特尔的定价策略和捆绑销售反应,这个数字可能会有比较大的误差。

 

AMD 负责数据中心事业部产品管理的企业副总裁 Ram Peddibhotla 告诉记者:“我们对在客户群中看到的势头感到非常兴奋。如果您看看我们的第三代 Epyc 与英特尔的 Ice Lake 相比可能节省的总拥有成本,您可能就会选择Epyc将其投入到您的核心业务中,它能帮助您全面提高业务效率。我以前说过这个,现在我会再说一遍。不采用 Epyc 实际上是有风险的,如果你不采用 Epyc,我认为你实际上处于严重的竞争劣势。”

 

关于这一点,基本上很难有争论,尤其在您查看了我们将要进行的性能比较之后,更会对此毫无疑义。在这里,我们要补充一个事实,即 AMD 正在与技术合作伙伴们合作,将 Epyc 芯片用于与企业相关的特定软件堆栈和解决方案。这将显着减少交易摩擦并推动企业采用,就像我们已经在 HPC 中心、公共云构建和超大规模计算机中看到的那样。

 

首先,让我们看一些相关的性能匹配,我们将从衡量整数和浮点性能的 SPEC CPU 基准测试开始。这些是加入服务器 CPU 战局中的筹码,如果你不能提供像样的 SPEC 数字,你就不会打动超大规模计算机、云构建和 OEM 厂商。如果您看看 SPECspeed2017 和 SPECrate2017 测试——它们有单插槽和双插槽版本,具有整数和浮点性能评级——AMD 的 Epyc 处理器在所有 16 个可能的类别中都排名第一。 (SPECspeed2017 衡量完成工作负载的时间,而 SPECrate2017 衡量的是单位时间内的吞吐量,因此在这方面它们略有不同。)在能效测试中,AMD 秒杀了 SPECpower2008 基准,并且在SPEC CPU 2017 能效基准测试中,除了一项之外,在所有基准测试中均排名第一。这是前所未有的胜利,但可能成为未来几代 x86 服务器 CPU 甚至所有类别服务器 CPU 之争的新常态。在很多情况下,第二代Epyc 7002系列处理器甚至可以击败英特尔第三代“Ice Lake”至强SP,然后Epyc 7003s拉开更大的差距。这是令英特尔感到上火且令人惊叹的事情:AMD 现在提供了更好的每核性能以及更好的 SKU 堆栈吞吐量。

 

下面是在 SPECrate2017 整数、浮点数和双插槽系统的 Java 基准测试中 top-bin 部分的比较,左边是“Ice Lake”Xeon SP,中间是 Epyc 7002s,右边是 Epyc 7003s:

 

   
“Ice Lake”和Epyc 7002的差距对于这些top-bin系统来说已经够糟糕了,但“Ice Lake”和Epyc 7003之间的差距更大。在整数性能测试中,AMD 的领先优势高达 47.2%,在浮点测试中为 36.5%,在 SPECjbb2015 测试中为 49.8%。 

 

那么,当都采用恒定数量的内核时的表现又如何呢,比如 32 个内核?结果仍然对英特尔不利。以下是针对 32 核 Epyc 7002、32 核“Ice Lake”和 32 核 Epyc 7003 部件的 SPECrate2017 测试: 

 


“Ice Lake”核心总体上看比 Epyc 7002 核心多一点点吸引力,但英特尔没有及时把Ice Lake引入市场,而同时间进入市场的 Epyc 7003 核心基于“ Zen 3”设计,性能上显然更胜一筹。因此,32 核 Epyc 7003 芯片可以比 32 核“Ice Lake”芯片多完成 34.2% 的整数工作和 30.6% 的浮点工作。

 

即使缩小英特尔“Ice Lake”和 AMD Epyc 7003 芯片的规模,正如您在下面这个比较中所看到的,英特尔的情况仍然不佳。该比较显示了 SPECrate2017 测试中的整数性能: 

 

 

从这里可以得出的信息是,如果英特尔想要保持其至强 SP 的出货量,它必须降低 CPU 价格并捆绑主板、网卡、FPGA 以及交易中的任何其他东西,以试图保持其收入流。不过,即使它这样做了,英特尔数据中心事业部的利润率也将受到重创,就像他们在 2021 年第一季度所遭受到的巨大打击那样。但是,这还只是 X86 服务器 CPU 市场潜在的价格战和持续技术运动的开始,战局初开,终局尚远。 

 

下面这张图表显示了 Epyc 7002 和 Epyc 7003 Epyc 7003 芯片 SKU 堆栈与 Intel Ice Lake Xeon SP 堆栈中最常见的 SKU 堆栈的比较,从而更容易看出这几者之间的竞争定位。

 


Peddibhotla 解释说:“AMD 在 Epyc 服务器平台的设计上别具匠心,以便在稳步提高每一代 Epyc 系列处理器的价值的同时,延长其使用寿命。市场上的许多服务器将继续支持第二代 Epyc 和新的第三代 Epyc 共存,因为最新一代进一步提高了每个内核的性能,并增加了其他核数选项以满足不同的工作负载需求。具有 8 至 16 核的Epyc 7002 系列面向入门级市场,实现整体拥有成本优化,从而带来巨大的价值。Epyc 7003 可以满足每核心或高密度性能需求。第二代 Epyc 在所有可用核心数量上都具有很高的性价比。”

 

 相比之下,英特尔正在让客户从“Skylake”和“Cascade Lake”Xeon SP 的“Purley”平台转向“Ice Lake”的“Whitley”平台,然后是未来第四代至强 SP“Sapphire Rapids”的“Eagle Stream”平台。 

 

尽管 SPEC 测试的原始性能是所有企业都需要考虑的重要因素,但他们想知道的是,如果升级几代以前(也许是四年前)的服务器,他们可以给自己的产品增加多大的吸引力。这方面有一个整合因素,而且这个因素更有利于 AMD: 

 


通常情况下,升级后,满足相同容量所需的服务器将少得多,或者在相同数量的物理服务器下降获得大得多的可用容量。在这种情况下,对于不到 4,000 个 SPECrate2017 整数单位的性能,您可以用五台 Epyc 7003  Epyc 7763 服务器替换 20 台双插槽“Broadwell”Xeon E5 v4 服务器以获得相同的性能,或者安装 20 台服务器并获得 4 倍的性能。假设上面显示的英特尔的“Ice Lake”和 AMD 的 Epyc 7003 服务器的成本大致相同,对于相同数量的服务器,您将获得大约 50% 的性能提升,这意味着您可以减少大约三分之一的服务器数量以获得同样的性能,花的钱也少三分之一。 

 

当然,你可以有很多不同的切分和组合方式。以下是一项为期三年的对整体拥有成本的深入分析,展示了这对于 10,000 SPECrate2017 整数性能单位的影响,显示了获取机器、管理它们、支付数据中心空间、电力和冷却费用的成本。这证实了我们上面所说的: 

 


为了回到这个位置,AMD 已经奋斗了很长时间。全世界的数据中心厂商都应该心存感激,英特尔独霸久矣,这个市场真的需要一些竞争。