AMD的第三代 EPYC CPU将英特尔面向数据中心的至强SPS逼上绝境

祸兮福所倚，福兮祸所伏，有时候，坏事情会变成可以彻底改变市场的绝佳机会。许多年后，当有人写下数据中心计算业务的历史时，他们会认为AMD利用台积电制造其第二代和第三代Epyc服务器处理器的内核是一件非常偶然的事情，但是，就是这种极具偶然性的选择让落后英特尔一个世代以上的 AMD 能够超越英特尔，并为自己建立可持续的工艺领先地位，而 AMD 与其服务器 CPU 的主要竞争对手相比还具有并行的架构优势。

自从 AMD 的 64 位 Opterons 集成了内存控制器、多核架构、HyperTransport 互连和其他高级功能，从而使得英特尔21世纪初的 32 位 Xeon 服务器芯片看起来可笑到荒谬以来，我们还没有看到英特尔在数据中心领域受到过如此严重的打击。直到英特尔在 2009 年通过其“Nehalem”至强 E5500 处理器克隆了 Opteron 设计的许多元素，它才能够推出一个同时在技术和经济上可以与 Opteron 替代方案竞争的服务器 CPU。

历史正在重演，AMD 今年 3 月份推出了其第三代 Epyc 7003 系列处理器（原代号为“Milan”）。而英特尔的“Ice Lake”至强 SP 服务器处理器，也是其最新系列的第三代，虽然相比于它们的前辈有了重大改进，但它在单核或总插槽吞吐量性能方面，它们依然无法与 Epyc 7003 系列处理器相媲美。在价格/性能和与现有服务器设计的兼容性方面，AMD 毫无悬念地在数据中心计算领域赢得了这场与英特尔的对决。正如我们所说，与 Xeon SP 系列中的“Skylake”和“Cascade Lake”前辈相比，英特尔的 Ice Lake 芯片有了很大的改进。但 AMD 在时钟、缓存和向量单位等方面都横扫了英特尔。

现在，我们终于得到了相关的数据来对 AMD 第三代 Epyc 芯片与英特尔“Ice Lake”芯片进行竞争分析对比，鉴于 AMD 的全面横扫，英特尔请回了 Pat Gelsinger 尝试重振至强 SP 产品线并挽救服务器 CPU 业务也就不足为奇了。经过七年的研究、开发和产品推出，AMD 的服务器出货量份额已经突破了10% ，并且似乎准备将这一份额翻一番——甚至更多——因为该公司将拥有可持续的架构和制造工艺优势。我们对此最好的猜测是，从现在起大约一年后，AMD 将拥有 25% 的服务器出货量份额——考虑到宏观经济因素以及英特尔的定价策略和捆绑销售反应，这个数字可能会有比较大的误差。

AMD 负责数据中心事业部产品管理的企业副总裁 Ram Peddibhotla 告诉记者：“我们对在客户群中看到的势头感到非常兴奋。如果您看看我们的第三代 Epyc 与英特尔的 Ice Lake 相比可能节省的总拥有成本，您可能就会选择Epyc将其投入到您的核心业务中，它能帮助您全面提高业务效率。我以前说过这个，现在我会再说一遍。不采用 Epyc 实际上是有风险的，如果你不采用 Epyc，我认为你实际上处于严重的竞争劣势。”

关于这一点，基本上很难有争论，尤其在您查看了我们将要进行的性能比较之后，更会对此毫无疑义。在这里，我们要补充一个事实，即 AMD 正在与技术合作伙伴们合作，将 Epyc 芯片用于与企业相关的特定软件堆栈和解决方案。这将显着减少交易摩擦并推动企业采用，就像我们已经在 HPC 中心、公共云构建和超大规模计算机中看到的那样。

首先，让我们看一些相关的性能匹配，我们将从衡量整数和浮点性能的 SPEC CPU 基准测试开始。这些是加入服务器 CPU 战局中的筹码，如果你不能提供像样的 SPEC 数字，你就不会打动超大规模计算机、云构建和 OEM 厂商。如果您看看 SPECspeed2017 和 SPECrate2017 测试——它们有单插槽和双插槽版本，具有整数和浮点性能评级——AMD 的 Epyc 处理器在所有 16 个可能的类别中都排名第一。（SPECspeed2017 衡量完成工作负载的时间，而 SPECrate2017 衡量的是单位时间内的吞吐量，因此在这方面它们略有不同。）在能效测试中，AMD 秒杀了 SPECpower2008 基准，并且在SPEC CPU 2017 能效基准测试中，除了一项之外，在所有基准测试中均排名第一。这是前所未有的胜利，但可能成为未来几代 x86 服务器 CPU 甚至所有类别服务器 CPU 之争的新常态。在很多情况下，第二代Epyc 7002系列处理器甚至可以击败英特尔第三代“Ice Lake”至强SP，然后Epyc 7003s拉开更大的差距。这是令英特尔感到上火且令人惊叹的事情：AMD 现在提供了更好的每核性能以及更好的 SKU 堆栈吞吐量。

下面是在 SPECrate2017 整数、浮点数和双插槽系统的 Java 基准测试中 top-bin 部分的比较，左边是“Ice Lake”Xeon SP，中间是 Epyc 7002s，右边是 Epyc 7003s：

“Ice Lake”和Epyc 7002的差距对于这些top-bin系统来说已经够糟糕了，但“Ice Lake”和Epyc 7003之间的差距更大。在整数性能测试中，AMD 的领先优势高达 47.2%，在浮点测试中为 36.5%，在 SPECjbb2015 测试中为 49.8%。

那么，当都采用恒定数量的内核时的表现又如何呢，比如 32 个内核？结果仍然对英特尔不利。以下是针对 32 核 Epyc 7002、32 核“Ice Lake”和 32 核 Epyc 7003 部件的 SPECrate2017 测试：

“Ice Lake”核心总体上看比 Epyc 7002 核心多一点点吸引力，但英特尔没有及时把Ice Lake引入市场，而同时间进入市场的 Epyc 7003 核心基于“ Zen 3”设计，性能上显然更胜一筹。因此，32 核 Epyc 7003 芯片可以比 32 核“Ice Lake”芯片多完成 34.2% 的整数工作和 30.6% 的浮点工作。

即使缩小英特尔“Ice Lake”和 AMD Epyc 7003 芯片的规模，正如您在下面这个比较中所看到的，英特尔的情况仍然不佳。该比较显示了 SPECrate2017 测试中的整数性能：

从这里可以得出的信息是，如果英特尔想要保持其至强 SP 的出货量，它必须降低 CPU 价格并捆绑主板、网卡、FPGA 以及交易中的任何其他东西，以试图保持其收入流。不过，即使它这样做了，英特尔数据中心事业部的利润率也将受到重创，就像他们在 2021 年第一季度所遭受到的巨大打击那样。但是，这还只是 X86 服务器 CPU 市场潜在的价格战和持续技术运动的开始，战局初开，终局尚远。

下面这张图表显示了 Epyc 7002 和 Epyc 7003 Epyc 7003 芯片 SKU 堆栈与 Intel Ice Lake Xeon SP 堆栈中最常见的 SKU 堆栈的比较，从而更容易看出这几者之间的竞争定位。

Peddibhotla 解释说：“AMD 在 Epyc 服务器平台的设计上别具匠心，以便在稳步提高每一代 Epyc 系列处理器的价值的同时，延长其使用寿命。市场上的许多服务器将继续支持第二代 Epyc 和新的第三代 Epyc 共存，因为最新一代进一步提高了每个内核的性能，并增加了其他核数选项以满足不同的工作负载需求。具有 8 至 16 核的Epyc 7002 系列面向入门级市场，实现整体拥有成本优化，从而带来巨大的价值。Epyc 7003 可以满足每核心或高密度性能需求。第二代 Epyc 在所有可用核心数量上都具有很高的性价比。”

相比之下，英特尔正在让客户从“Skylake”和“Cascade Lake”Xeon SP 的“Purley”平台转向“Ice Lake”的“Whitley”平台，然后是未来第四代至强 SP“Sapphire Rapids”的“Eagle Stream”平台。

尽管 SPEC 测试的原始性能是所有企业都需要考虑的重要因素，但他们想知道的是，如果升级几代以前（也许是四年前）的服务器，他们可以给自己的产品增加多大的吸引力。这方面有一个整合因素，而且这个因素更有利于 AMD：

通常情况下，升级后，满足相同容量所需的服务器将少得多，或者在相同数量的物理服务器下降获得大得多的可用容量。在这种情况下，对于不到 4,000 个 SPECrate2017 整数单位的性能，您可以用五台 Epyc 7003 Epyc 7763 服务器替换 20 台双插槽“Broadwell”Xeon E5 v4 服务器以获得相同的性能，或者安装 20 台服务器并获得 4 倍的性能。假设上面显示的英特尔的“Ice Lake”和 AMD 的 Epyc 7003 服务器的成本大致相同，对于相同数量的服务器，您将获得大约 50% 的性能提升，这意味着您可以减少大约三分之一的服务器数量以获得同样的性能，花的钱也少三分之一。

当然，你可以有很多不同的切分和组合方式。以下是一项为期三年的对整体拥有成本的深入分析，展示了这对于 10,000 SPECrate2017 整数性能单位的影响，显示了获取机器、管理它们、支付数据中心空间、电力和冷却费用的成本。这证实了我们上面所说的：

为了回到这个位置，AMD 已经奋斗了很长时间。全世界的数据中心厂商都应该心存感激，英特尔独霸久矣，这个市场真的需要一些竞争。

器件型号	数量	器件厂商	器件描述	ECAD模型	参考价格	更多信息
TMS320F28377DPTPT	1	Texas Instruments	C2000™ 32-bit MCU with 800 MIPS, 2xCPU, 2xCLA, FPU, TMU, 1024 KB flash, EMIF, 16b ADC 176-HLQFP -40 to 105	ECAD模型下载ECAD模型	$25.67	查看
ATXMEGA32A4U-AU	1	Microchip Technology Inc	IC MCU 8BIT 32KB FLASH 44TQFP	ECAD模型下载ECAD模型	$3.78	查看
ATMEGA128A-MUR	1	Microchip Technology Inc	IC MCU 8BIT 128KB FLASH 64QFN		$7.34	查看

器件型号

数量

器件厂商

器件描述

数据手册

ECAD模型

风险等级

参考价格

更多信息

TMS320F28377DPTPT

Texas Instruments

C2000™ 32-bit MCU with 800 MIPS, 2xCPU, 2xCLA, FPU, TMU, 1024 KB flash, EMIF, 16b ADC 176-HLQFP -40 to 105