近日,里肯计算科学中心(r-ccs)宣布,它将在 8 月份拔掉其旗舰 HPC 系统 K 计算机的插头。这台 11-petaflop 超级计算机至今仍在运行中,但由于即将到来的 Post-K 系统将安装在同一个计算机室中,而 Riken 需要花精力在新的 exascale 机器准备设备。
当 K 在 2011 年安装时,它是 TOP500 列表中的头号系统。在当时,它被列为世界上第 18 强超级计算机,同时也是 petascale 俱乐部中最节能的超级计算机之一。就算是现在,它仍然排在 Green500 排行榜上的第 199 位,这对于一台已有 8 年历史的机器来说并不算太糟糕。
在 Post-K 部署之前关闭 K 的决定归结为从一个系统转换到另一个系统的所需要的背后成本。根据 R-CCS 主管松冈(Satoshi Matsuoka)的说法,该设施的一些基础设施将被重新规划以节省成本,但需要升级才能使 Post-K 所需的电力和冷却能力翻倍。考虑到它的性能是 K 的 100 倍,中心只需要为新机器提供双倍功率和冷却,这个事实让人震惊。
提前关闭的另一个原因是,设施已满,当 K 后机架开始滚动时, Riken 需要 K 占用的空间,根据 Matsuoka 的说法,K 后机架将在今年晚些时候开始滚动。因此,“在建造 Post-K 时运行 K 变得不可能”,他解释道。
像它的 Petascale 前身一样,Post-K 也是富士通开发的。该原型于 2018 年 6 月首次亮相,随后于 8 月推出了该系统的 A64FX 芯片。如果一切按计划进行,机器将在 2021 年某个时候投入全面生产。
从 K 到 Post-K 的过渡不仅仅是从 petascale 到 exascale 的过渡。它还反映了现代 HPC 机械的不断变化的偏好。最初的 K 由富士通定制的 8 核 Sparc64 VIIIfx 芯片驱动。在 A64FX 中,K 系列已移至 Arm,这是一种特殊品种的 Arm 处理器,其中包含可扩展矢量扩展(SVE)功能。最初的实现提供了 48 个核心,但是在 Post-K 中出现的核心可能要多得多。
在富士通的设计中,A64FX 的 SIMD 硬件将为 512 位宽。它大到可以同时处理八个 FP64 值,这将使其在矢量数学上比 K 的 Sparc64 VIIIfx 快四倍,假设时钟速率相等。 A64FX 还将提供 FP32,FP16,INT16 和 INT8 指令,以支持通常用于机器学习的各种数学运算。
从定制处理器体系结构向标准处理器体系结构的转变反映了 HPC 领域的长期趋势,这种趋势始于 90 年代初,并且今天仍在继续发挥作用。正如我们最近报道的那样,由于摩尔定律的恶化和机器学习的重要性日益提高,这可能会开始向另一个方向转变。但至少目前,标准架构占据上风。
最近对芯片支持低精度数学用于机器学习的热情正在席卷所有处理器架构,无论是否标准。传统 HPC 也在考虑降低精度数学,以提高吞吐量和能效。因此,几乎可以肯定,在可预见的未来,亿亿级超级计算机中的所有处理器,更不用说通用数据中心机器,都将支持更低精度的格式。
也就是说,富士通的新款 Arm 芯片,就像其 Sparc64 的前身一样,仍然是一款专用的 HPC 处理器。正如我们之前提到的,A64FX 确实继承了 Sparc64 架构的超标量处理,无序执行和分支预测功能。 Post-K 还将继续沿着 Fujitsu 的定制豆腐互连的道路前进,该互连最初是为 K 计算机开发的。 Post-K 版本代表了第三代架构,称为 Tofu D。
关闭 K 势必会对用户造成一些干扰。 Matsuoka 做出保证,日本的其他 HPC 中心将在此期间收拾残局,直到 Post-K 上线,从表面上看,这不应该太长。他说,精选用户将在 2020 年上半年提前进入该系统,然后在 2021 年正式投产使用。
与非网编译内容,未经许可,不得转载!