IBM 于年度 Hot Chips 技术大会上介绍 Power 9 处理器的更多细节,它可望成为一款突破性的晶片,催生系统厂商与加速器供应商建立新的夥伴关系,IBM 首度于上周在美国矽谷举行的年度 Hot Chips 技术大会上介绍 Power 9 处理器的更多细节,它可望成为一款突破性的晶片,催生系统厂商与加速器供应商建立新的夥伴关系,并重新点燃 IBM 阵营与对手 Intel 在高阶伺服器市场的战火。

 

采用 14 纳米制程的 Power 9 是在今年 3 月首度被提及,在正热门的加速器应用领域采取了大胆、在某种程度上又有些分散化的策略;这也是 IBM 的 Power 架构处理器晶片首度以系列产品的形式问世,能支援各种性能升级或横向扩展的系统设计。

 

如同以往的 IBM 微处理器,为了要达到新的性能水准,Power 9 采用了大量的记忆体──包括透过晶片上 7 Tbit/second 速率光纤共享 L3 快取、总计 120Mbyte 的嵌入式 DRAM。而 Power 9 的主架构师 Brian Thompto 表示,从各项性能基准量测来看,Power 9 号称在明年底正式问世时,其性能可比 Power 8 提升 50%至两倍。

 

Power 9 将有四个版本,采用 DDR4 DIMM,可望吸引对成本特别敏感的厂商 (图片来源:IBM)

 

Power 9 的性能提升主要是新核心以及晶片层级设计的贡献。IBM 将推出四个版本的 Power 9,其中有两个版本采用每核心 8 执行续(thread)、每晶片 12 核心的架构,支援 IBM 的 Power 虚拟化环境;另两个版本将采用每核心 4 执行续、每晶片 24 核心架构,锁定 Linux 环境。两种架构都会有分别为适用双插槽伺服器、8 个 DDR4 连接埠,以及配备缓冲 DIMM、支援单伺服器多晶片的两种版本。

 

这种多样化选择性可望吸引更多客户青睐;IBM 一直尝试鼓励其他厂商透过其 OpenPower 组织打造 Power 架构系统,目前该组织成员已超过 200 家,中国厂商对此兴趣最浓厚,当地并有一家 IBM 合作夥伴正在打造自有 Power 架构晶片。在某些地方采用标准 DDR 4 DIMM,能透过支援成熟封装技术,为系统厂商降低进入门槛并因此降低成本。

 

Power 9 的 120 Mbyte L3 快取记忆体,分成多个 10 Mbyte 区块由两个处理器核心共享(图片来源:IBM)

 

而 Power 9 的加速策略或许是它最有趣的地方。该晶片会是首批实现 16 GTransfer/second 速率 PCI Express (PCIe) 4 互连的微处理器,该新规格的最终版本仍在等待批准;此外 Power 9 采用被称为 IBM BlueLink 的新一代 25 Gbit/s 实体互连。

 

上述两种互连技术都支援 48 通道(lane),并将包含多种通讯协议;PCIe 连结将采用 IBM 的 CAPI 2.0 介面与 FPGA 与 ASIC 连结;BlueLink 将承载为 Nvidia 的绘图处理器(GPU)与一种新 CAPI 介面所共同开发的新一代 NVLink。新的 CAPI 协议与 25G BlueLink 可能是 IBM 为了支援 CCIX 快取一致性连结(cache coherent link)的提案;该互连介面规格正由成员包括 AMD、ARM、华为(Huawei)、Mellanox、Qualcomm 与 Xilinx 在内的一个产业组织订定中。

 

CCIX 的目标是催生取代 Nvidia 与 Intel 独家互连规格的新介面技术;目前该组织已经有数十家成员,预计今年稍晚将会公布包括其规格最终版本出炉时间等更进一步的讯息。Intel 收购了 Altera 并承诺打造结合 Altera FPGA、3D XPoint 记忆体以及其 Xeon 处理器的方案,采用 Intel 专有的 OmniPath 互连技术。

 

各种加速互连技术的开发,主要是为了因应新兴的机器学习应用,以及为了提升系统性能而越来越有需求的专属协同处理器;对此 IBM 的 Thompto 表示:“已经有大量的投资以及最佳化技术投入这个领域,这是未来风潮。”

 

Power 9 包含支援 4 种通讯协议的两种互连技术,以及 SMP 汇流排 (图片来源:IBM)

 

而 IBM 仍在等待新一代储存级记忆体技术的诞生,该公司已经投入相变化(phase-change)记忆体研发多年,可能会需要在接下来一两年回应 Intel 的 XPoint 产品;Intel 计划在新系列非挥发性 DIMM 采用 XPoint 记忆体以提升伺服器的性能,时程约在 2018 年。Thompto 表示:“我们打造新版 CAPI 的原因之一是为了永久记忆体…它可能会直接以记忆体模组的形式出现。”