美国想凭Summit夺回超级计算机霸主地位，要看IBM和英伟达实力有多强？

美国谋求重新夺回超级计算机霸主地位；

IBM 终于开始出货其独具风格的 Power9 处理器；

英伟达的 Volta GPU 将成为 Summit 和 Sierra 的主力计算单元。

美国欲凭借 Summit 超级计算机重回世界之巅
计算机领域的军备竞赛对国际关系和地缘政治的影响和其它任何常规军备竞赛一样重要。这是一场关于打造出全球最快的超级计算机的竞赛。拥有最快的超级计算机不仅仅关乎民族自豪感，它还具备货真价实的经济、政治和军事利益。超级计算机有诸多用武之地，不仅可以用于大范围地区的天气预报，还可以用于核武器的建模和设计。

目前，世界上最快的超级计算机是中国的神威·太湖之光，其运算能力能够达到惊人的 93 PetaFLOPS，即每秒执行 93×10 ^ 15 次浮点运算。 2018 年，美国计划在田纳西州的橡树岭国家实验室（ORNL）打造出超过神威·太湖之光的超级计算机。这台名为 Summit 的超级计算机的运算能力将达到 200 PetaFLOPS，同时，加利福尼亚州的劳伦斯利弗莫尔国家实验室也正在建造一个设计上与 Summit 类似的姊妹计算机 Sierra。

Summit 由大约 4600 个“节点”组成，这些节点基本上都是机架式服务器。虽然 Summit 的计算能力将比其前任强大 5-10 倍，但它的节点只有前任的 1/4，而且耗电量也大大降低。

这台超级计算机这么强悍，靠的是这些节点的特殊内在。每个节点都包含一个由 IBM 设计的专用 HPC（高性能计算）服务器。该节点包含两个 IBM Power9 处理器、六个英伟达的 Tesla V100 SXM2 GPU 加速器，而且整个盒子采用水冷设计，如文章顶部的硬件照片所示。该硬件最近曾在全球超算大会 SC17 上展出过。

IBM 系统的独特之处在于，每个 Power9 处理器都通过英伟达专有的高速 NVLink 数字接口直接与英伟达的 GPU 通信。这种内置功能是 Power9 独有的，可通过 NVLink 2.0 实现 100 GB/ 秒的吞吐能力。

如 Tom 硬件的图中所示，整个系统架构广泛使用 NVLink 连接各个 Power9 处理器、各个 GPU，并将 GPU 和 Power9 处理器互相连接在一起。

在实际工作中，由这些 Power9 处理器协调每个节点的计算流程，Tesla V100 则负责繁重的计算工作。IBM 将 NVLink 2 接口集成到芯片上这个设计决策表明它深谙高性能计算的发展方向。IBM 并没有抗拒越来越流行使用 GPU 进行计算的趋势，而是明智地选择了它。

IBM 终于开始出货其独具一格的 Power9 处理器
每颗 Power9 处理器本身就是一台功能强大的计算机，最多可包含 24 个处理器内核，每个内核可以并行执行四个线程，Power9 支持 96 个线程的并行计算。此外，每颗 Power9 还支持 48 路 PCIE 4.0 通道和 8 个内存通道。

IBM 的 Power 处理器系列基于 PowerPC RISC 架构，曾经用在苹果的 Mac 电脑上，当苹果公司改用英特尔的 x86 处理器后，IBM 将重点放在了服务器市场上。

客户早就对 Power9 望眼欲穿，IBM 去年发布了这颗芯片，人们普遍预计 IBM 将在 2017 年年底出货这颗芯片。根据目前得到的消息，Power9 已经应用在 Sierra 和 Summit 上，但是 IBM 并没有公布 Power9 全面供货的信息，现在业界认为该芯片可能于 2018 年初上市销售。

Power9 是一个庞大无比的芯片，这可能是它迟迟没有面世的原因。 Power9 现在采用格罗方德的 14 纳米制程制造。它可能是格罗方德试图在其 14 纳米节点工艺上制造的最大的芯片，所以，如果产能和良率达不到 IBM 的预期，我一点都不会感到惊讶。同样影响产能和良率的一个因素是，Power9 是一颗庞大而且复杂的高性能芯片。

英伟达 Volta GPU 将成为 Summit 和 Sierra 的主力计算单元
Summit 和 Sierra 都将使用相似的搭载双 Power9 处理器的 IBM HPC 计算机，它们两个的主要区别在于 Sierra 每个节点只有四个 Tesla V100 GPU，而 Summit 每个节点包含六个 Tesla V100 SXM2 GPU。虽然 GPU 数量更少，但是这种设计方式可以实现 CPU 和 GPU 之间 150 GB/ 秒的 NVLink 2 通信速度，从而提高吞吐能力。

Tesla V100 中的每个 GV100 GPU 都比 Power9 更加庞大，正是因为每个 V100 都需要消耗 300 瓦的功率，才使用了昂贵的水冷解决方案。据预计，整个 Summit 的的功耗为 13 兆瓦，而拥有 4000-5000 个节点的 Sierra 的功耗为 11 兆瓦。就所有实际应用而言，Summit 和 Sierra 的计算能力大小主要取决于 Tesla V100 GPU 的能力限制。

从美国这两款超级计算机可以一窥英伟达 V100 GPU 的市场机会。这两个系统将使用超过 45,000 个 V100 GPU，美国能源部的一位客户表示，每颗 V100 GPU 的价格在 8000 美元左右，这两台超级计算机为 Tesla V100 贡献的销售额就超过了 3.6 亿美元。

IBM 和英伟达很可能会成为全球超级计算领域的强势存在，并持续受益于永无休止的打造更快超级计算机的军备竞赛。

更多有关超级计算机的资讯，欢迎访问与非网超级计算机专区

与非网编译内容，未经许可，不得转载！

器件型号	数量	器件厂商	器件描述	ECAD模型	参考价格	更多信息
KSZ8851SNLI	1	Microchip Technology Inc	DATACOM, ETHERNET TRANSCEIVER, PQCC32		$5.06	查看
CY62157EV30LL-45BVXI	1	Cypress Semiconductor	Standard SRAM, 512KX16, 45ns, CMOS, PBGA48, VFBGA-48		$13.43	查看
TLP172AM(E	1	Toshiba America Electronic Components	TRANSISTOR OUTPUT SOLID STATE RELAY, 3750V ISOLATION-MAX	ECAD模型下载ECAD模型	$2.34	查看

器件型号

数量

器件厂商

器件描述

数据手册

ECAD模型

风险等级

参考价格

更多信息

KSZ8851SNLI

Microchip Technology Inc

DATACOM, ETHERNET TRANSCEIVER, PQCC32