美国想凭Summit夺回超级计算机霸主地位,要看IBM和英伟达实力有多强?

2017-11-24 08:54:21 来源:EEFOCUS
标签:

美国谋求重新夺回超级计算机霸主地位;

IBM终于开始出货其独具风格的Power9处理器;

英伟达的Volta GPU将成为Summit和Sierra的主力计算单元。


美国欲凭借Summit超级计算机重回世界之巅
计算机领域的军备竞赛对国际关系和地缘政治的影响和其它任何常规军备竞赛一样重要。这是一场关于打造出全球最快的超级计算机的竞赛。拥有最快的超级计算机不仅仅关乎民族自豪感,它还具备货真价实的经济、政治和军事利益。超级计算机有诸多用武之地,不仅可以用于大范围地区的天气预报,还可以用于核武器的建模和设计。

目前,世界上最快的超级计算机是中国的神威·太湖之光,其运算能力能够达到惊人的93 PetaFLOPS,即每秒执行93×10 ^ 15次浮点运算。 2018年,美国计划在田纳西州的橡树岭国家实验室(ORNL)打造出超过神威·太湖之光的超级计算机。这台名为Summit的超级计算机的运算能力将达到200 PetaFLOPS,同时,加利福尼亚州的劳伦斯利弗莫尔国家实验室也正在建造一个设计上与Summit类似的姊妹计算机Sierra。

 


Summit由大约4600个“节点”组成,这些节点基本上都是机架式服务器。虽然Summit的计算能力将比其前任强大5-10倍,但它的节点只有前任的1/4,而且耗电量也大大降低。

这台超级计算机这么强悍,靠的是这些节点的特殊内在。每个节点都包含一个由IBM设计的专用HPC(高性能计算)服务器。 该节点包含两个IBM Power9处理器、六个英伟达的Tesla V100 SXM2 GPU加速器,而且整个盒子采用水冷设计,如文章顶部的硬件照片所示。该硬件最近曾在全球超算大会SC17上展出过。

IBM系统的独特之处在于,每个Power9处理器都通过英伟达专有的高速NVLink数字接口直接与英伟达的GPU通信。 这种内置功能是Power9独有的,可通过NVLink 2.0实现100 GB/秒的吞吐能力。

如Tom硬件的图中所示,整个系统架构广泛使用NVLink连接各个Power9处理器、各个GPU,并将GPU和Power9处理器互相连接在一起。

 


在实际工作中,由这些Power9处理器协调每个节点的计算流程,Tesla V100则负责繁重的计算工作。IBM将NVLink 2接口集成到芯片上这个设计决策表明它深谙高性能计算的发展方向。IBM并没有抗拒越来越流行使用GPU进行计算的趋势,而是明智地选择了它。

IBM终于开始出货其独具一格的Power9处理器
每颗Power9处理器本身就是一台功能强大的计算机,最多可包含24个处理器内核,每个内核可以并行执行四个线程,Power9支持96个线程的并行计算。此外,每颗Power9还支持48路PCIE 4.0通道和8个内存通道。

IBM的Power处理器系列基于PowerPC RISC架构,曾经用在苹果的Mac电脑上,当苹果公司改用英特尔的x86处理器后,IBM将重点放在了服务器市场上。

 


客户早就对Power9望眼欲穿,IBM去年发布了这颗芯片,人们普遍预计IBM将在2017年年底出货这颗芯片。根据目前得到的消息,Power9已经应用在Sierra和Summit上,但是IBM并没有公布Power9全面供货的信息,现在业界认为该芯片可能于2018年初上市销售。

Power9是一个庞大无比的芯片,这可能是它迟迟没有面世的原因。 Power9现在采用格罗方德的14纳米制程制造。它可能是格罗方德试图在其14纳米节点工艺上制造的最大的芯片,所以,如果产能和良率达不到IBM的预期,我一点都不会感到惊讶。同样影响产能和良率的一个因素是,Power9是一颗庞大而且复杂的高性能芯片。

英伟达Volta GPU将成为Summit和Sierra的主力计算单元
Summit和Sierra都将使用相似的搭载双Power9处理器的IBM HPC计算机,它们两个的主要区别在于Sierra每个节点只有四个Tesla V100 GPU,而Summit每个节点包含六个Tesla V100 SXM2 GPU。虽然GPU数量更少,但是这种设计方式可以实现CPU和GPU之间150 GB/秒的NVLink 2通信速度,从而提高吞吐能力。

 


Tesla V100中的每个GV100 GPU都比Power9更加庞大,正是因为每个V100都需要消耗300瓦的功率,才使用了昂贵的水冷解决方案。据预计,整个Summit的的功耗为13兆瓦,而拥有4000-5000个节点的Sierra的功耗为11兆瓦。就所有实际应用而言,Summit和Sierra的计算能力大小主要取决于Tesla V100 GPU的能力限制。

从美国这两款超级计算机可以一窥英伟达V100 GPU的市场机会。这两个系统将使用超过45,000个V100 GPU,美国能源部的一位客户表示,每颗V100 GPU的价格在8000美元左右,这两台超级计算机为Tesla V100贡献的销售额就超过了3.6亿美元。

IBM和英伟达很可能会成为全球超级计算领域的强势存在,并持续受益于永无休止的打造更快超级计算机的军备竞赛。

 

更多有关超级计算机的资讯,欢迎访问 与非网超级计算机专区

 

与非网编译内容,未经许可,不得转载!

 

 
关注与非网微信 ( ee-focus )
限量版产业观察、行业动态、技术大餐每日推荐
享受快时代的精品慢阅读
 

 

作者简介
与非网小编
与非网小编

电子行业垂直媒体--与非网小编一枚,愿从海量行业资讯中淘得几粒金沙,与你分享!

继续阅读
英特尔、AMD、英伟达的“芯片三国”

芯片巨头的战场从来都不寂寞,在激烈的捉对厮杀中,英特尔、AMD、英伟达这场三国大戏已经延续了数十载。

AMD发布新款CPU,性能参数如何?
AMD发布新款CPU,性能参数如何?

9月18日早间消息,AMD在官网低调公布了两款全新的锐龙APU产品,Ryzen 7 2800H和Ryzen 5 2600H,这是用于笔记本平台的标压处理器,按照早先的说法,它们被AMD划分到“Raven Ridge 2018”阵容。

2018年半导体领域最大的赢家和失意者,四个候选者你选谁?
2018年半导体领域最大的赢家和失意者,四个候选者你选谁?

这是一场围绕半导体生态圈的持久话题。最大赢家我的选择是台积电。他们迎来一个丰收年,而未来也会如此。GF终止7nm让AMD转入台积电帐下,传闻称英特尔也将转移部分产能到台积电,当然苹果和其他产业界已经开始在台积电流片7nm让其继续保持行业领先,可以提前庆祝这一年的胜利了。

未来5年MCU市场将保持7.2%年复合增长率,看哪些市场是推手
未来5年MCU市场将保持7.2%年复合增长率,看哪些市场是推手

嵌入式控制在系统中的广泛应用、更多的传感器以及将终端应用连接到物联网(IoT)的热潮,推动了MCU的销售和设备出货量。

英特尔发生彻底变化?将发布的人工智能架构Nervana是什么鬼

近日,英特尔人工智能产品事业部副总裁Gadi Singer接受了媒体访谈,谈论了英特尔在深度学习领域的长期愿景,以及为什么公司看好x86之外的架构和单芯片解决方案。

更多资讯
开发嵌入式系统的交互界面很难吗?教你一招快速搞定

工业产品的交互界面开发要求越来越接近于消费领域的产品。选择一种快速且低成本的嵌入式UI开发方案显得尤为重要,本文将为您介绍一种新的框架式嵌入式UI开发平台。

从NAND闪存中启动U-BOOT的设计和原理

本文介绍了S3C2410中NAND闪存的工作原理,分析了从NAND闪存启动U-BOOT的设计思路,并着重描述了NAND闪存支持U-BOOT的程序设计,移植后U-BOOT在嵌入式系统中运行良好。,

基于ARM的嵌入式系统CF卡与CPLD连接技术详解

随着应用需求的不断提高,许多嵌入式系统在应用时都要求带有扩展的大容量存储器来存储数据。CF 卡(Compact Flsah Card)由于价格便宜、存储容量大、体积小、兼容性好等优点被广泛应用于嵌入式产品。

RISC-V对ARM,杀势已成!

ARM架构过去称作进阶精简指令集机器(Advanced RISC Machine),又称“高级RISC机器”,是一个32位精简指令集(RISC)处理器架构。RISC-V是一种新的开放且免费的指令集架构。

最新经济高效入门级平台 面向高端嵌入式运算

提供标准和定制化嵌入式计算机板卡与模块的领先供应商—德国康佳特科技,推出全新跌破价格的计算机模块,该模块基于英特尔最新酷睿™ i3-8100H 处理器平台,是高端嵌入式运算的入门款模块。

Moore8直播课堂
电路方案