美国想凭Summit夺回超级计算机霸主地位,要看IBM和英伟达实力有多强?

2017-11-24 08:54:21 来源:EEFOCUS
分享到:
标签:

美国谋求重新夺回超级计算机霸主地位;

IBM终于开始出货其独具风格的Power9处理器;

英伟达的Volta GPU将成为Summit和Sierra的主力计算单元。


美国欲凭借Summit超级计算机重回世界之巅
计算机领域的军备竞赛对国际关系和地缘政治的影响和其它任何常规军备竞赛一样重要。这是一场关于打造出全球最快的超级计算机的竞赛。拥有最快的超级计算机不仅仅关乎民族自豪感,它还具备货真价实的经济、政治和军事利益。超级计算机有诸多用武之地,不仅可以用于大范围地区的天气预报,还可以用于核武器的建模和设计。

目前,世界上最快的超级计算机是中国的神威·太湖之光,其运算能力能够达到惊人的93 PetaFLOPS,即每秒执行93×10 ^ 15次浮点运算。 2018年,美国计划在田纳西州的橡树岭国家实验室(ORNL)打造出超过神威·太湖之光的超级计算机。这台名为Summit的超级计算机的运算能力将达到200 PetaFLOPS,同时,加利福尼亚州的劳伦斯利弗莫尔国家实验室也正在建造一个设计上与Summit类似的姊妹计算机Sierra。

 


Summit由大约4600个“节点”组成,这些节点基本上都是机架式服务器。虽然Summit的计算能力将比其前任强大5-10倍,但它的节点只有前任的1/4,而且耗电量也大大降低。

这台超级计算机这么强悍,靠的是这些节点的特殊内在。每个节点都包含一个由IBM设计的专用HPC(高性能计算)服务器。 该节点包含两个IBM Power9处理器、六个英伟达的Tesla V100 SXM2 GPU加速器,而且整个盒子采用水冷设计,如文章顶部的硬件照片所示。该硬件最近曾在全球超算大会SC17上展出过。

IBM系统的独特之处在于,每个Power9处理器都通过英伟达专有的高速NVLink数字接口直接与英伟达的GPU通信。 这种内置功能是Power9独有的,可通过NVLink 2.0实现100 GB/秒的吞吐能力。

如Tom硬件的图中所示,整个系统架构广泛使用NVLink连接各个Power9处理器、各个GPU,并将GPU和Power9处理器互相连接在一起。

 


在实际工作中,由这些Power9处理器协调每个节点的计算流程,Tesla V100则负责繁重的计算工作。IBM将NVLink 2接口集成到芯片上这个设计决策表明它深谙高性能计算的发展方向。IBM并没有抗拒越来越流行使用GPU进行计算的趋势,而是明智地选择了它。

IBM终于开始出货其独具一格的Power9处理器
每颗Power9处理器本身就是一台功能强大的计算机,最多可包含24个处理器内核,每个内核可以并行执行四个线程,Power9支持96个线程的并行计算。此外,每颗Power9还支持48路PCIE 4.0通道和8个内存通道。

IBM的Power处理器系列基于PowerPC RISC架构,曾经用在苹果的Mac电脑上,当苹果公司改用英特尔的x86处理器后,IBM将重点放在了服务器市场上。

 


客户早就对Power9望眼欲穿,IBM去年发布了这颗芯片,人们普遍预计IBM将在2017年年底出货这颗芯片。根据目前得到的消息,Power9已经应用在Sierra和Summit上,但是IBM并没有公布Power9全面供货的信息,现在业界认为该芯片可能于2018年初上市销售。

Power9是一个庞大无比的芯片,这可能是它迟迟没有面世的原因。 Power9现在采用格罗方德的14纳米制程制造。它可能是格罗方德试图在其14纳米节点工艺上制造的最大的芯片,所以,如果产能和良率达不到IBM的预期,我一点都不会感到惊讶。同样影响产能和良率的一个因素是,Power9是一颗庞大而且复杂的高性能芯片。

英伟达Volta GPU将成为Summit和Sierra的主力计算单元
Summit和Sierra都将使用相似的搭载双Power9处理器的IBM HPC计算机,它们两个的主要区别在于Sierra每个节点只有四个Tesla V100 GPU,而Summit每个节点包含六个Tesla V100 SXM2 GPU。虽然GPU数量更少,但是这种设计方式可以实现CPU和GPU之间150 GB/秒的NVLink 2通信速度,从而提高吞吐能力。

 


Tesla V100中的每个GV100 GPU都比Power9更加庞大,正是因为每个V100都需要消耗300瓦的功率,才使用了昂贵的水冷解决方案。据预计,整个Summit的的功耗为13兆瓦,而拥有4000-5000个节点的Sierra的功耗为11兆瓦。就所有实际应用而言,Summit和Sierra的计算能力大小主要取决于Tesla V100 GPU的能力限制。

从美国这两款超级计算机可以一窥英伟达V100 GPU的市场机会。这两个系统将使用超过45,000个V100 GPU,美国能源部的一位客户表示,每颗V100 GPU的价格在8000美元左右,这两台超级计算机为Tesla V100贡献的销售额就超过了3.6亿美元。

IBM和英伟达很可能会成为全球超级计算领域的强势存在,并持续受益于永无休止的打造更快超级计算机的军备竞赛。

 

更多有关超级计算机的资讯,欢迎访问 与非网超级计算机专区

 

与非网编译内容,未经许可,不得转载!

 

 
关注与非网微信 ( ee-focus )
限量版产业观察、行业动态、技术大餐每日推荐
享受快时代的精品慢阅读
 

 

作者简介
与非网小编
与非网小编

电子行业垂直媒体--与非网小编一枚,愿从海量行业资讯中淘得几粒金沙,与你分享!

继续阅读
AI芯片大比拼:GPU/FPGA/ASIC/类脑芯片,哪个更牛?

2017年,“人工智能”俨然已经成为所有媒体的头条热点,在媒体和资本的推动下,AI以迅雷不及掩耳之势向我们汹涌奔来。从政策层面,2017年关于AI发生了三件大事,一是发布了人工智能发展规划;二是人工智能首次写入十九大报告;三是很多城市,如上海、重庆等都在进行人工智能规划。

CPU处理器芯片面临架构重塑,幽灵和熔断漏洞有这么大威力?
CPU处理器芯片面临架构重塑,幽灵和熔断漏洞有这么大威力?

最近,安全机构公布了两种将给CPU市场带来潜在破坏的处理器安全缺陷;处理器市场领导者英特尔受冲击最严重,需应对两种安全缺陷,AMD则面临其中一种难以修复、目前尚没有解决方案的漏洞

英伟达GPU逃过一劫,黄仁勋“嘲讽”CPU

英特尔日前发布声明称,近期的补丁可能对某些芯片会造成影响,导致计算机出现比正常情况下重启更为频繁的现象。

你知道GPU渲染流水线是怎样的过程吗?

顶点着色器 ——> 曲面细分着色器(可选)----->几何着色器(可选)----->裁剪——>屏幕映射

英特尔要和紫光一起开发3D NAND芯片?美光怎么办
英特尔要和紫光一起开发3D NAND芯片?美光怎么办

美光科技和英特尔已经宣布将停止联合开发3D NAND的计划,有报告显示,英特尔可能会和中国的清华紫光(该公司几年前曾经试图收购美光)共同开发3D NAND。

更多资讯
服务器和标准型DRAM依然看涨

南亚科总经理李培瑛16日表示,今年上半年DRAM价格持续看涨,但涨幅会收敛些,下半年则仍待观察三星、 SK海力士二大韩厂实际增产内容才能做明确分析。 目前来看,韩国二大厂都表明将依市场需求增产,分析DRAM产业到明年都可维持健康稳定。

学习Linux,这些内核常识你应该要知道

如果没有操作系统,内存需要程序自己来管理。譬如在uboot中要使用哪块内存,由程序自己决定的,没有注册也没有限制。此时如果程序不小心把同一块内存重复使用,就会出现程序逻辑错误。

FSMC知识详解,以及驱动TFTLCD原理
FSMC知识详解,以及驱动TFTLCD原理

FSMC:灵活的静态存储控制器

Linux驱动之Nand Flash四问,原理、工作方式都包含了
Linux驱动之Nand Flash四问,原理、工作方式都包含了

Nand Flash 是一个存储芯片那么:这样的操作很理“ 读地址A的数据,把数据B写到地址A”

GPIO内部结构、工作原理及相关寄存器详解(以STM32为例)
GPIO内部结构、工作原理及相关寄存器详解(以STM32为例)

STM32F1系列IO口的基本结构()IO口内部电路结构)

Moore8直播课堂
电路方案