加入星计划,您可以享受以下权益:

  • 创作内容快速变现
  • 行业影响力扩散
  • 作品版权保护
  • 300W+ 专业用户
  • 1.5W+ 优质创作者
  • 5000+ 长期合作伙伴
立即加入
  • 正文
    • 云上HPC成为未来趋势
    • 自研芯片的进阶之路
    • 自研Graviton3E处理器,为HPC打造高性价比
    • 解决云上HPC的“两难”问题
    • 写在最后
  • 推荐器件
  • 相关推荐
  • 电子产业图谱
申请入驻 产业图谱

从“芯”出发,高性能计算的云上普及之路

2022/12/20
1967
阅读需 12 分钟
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

“云的规模正在重新定义HPC(高性能计算),它带来的应用和创新改变了游戏规则。如果没有针对每个特定工作负载优化的一系列实例,就无法为HPC创建具有成本效益的性能基础,而HPC的极端规模意味着即使看似很小的资源差异也可能对性能、成本和运行速度产生重大影响”,亚马逊云科技CEO Adam Selipsky在2022 re:Invent全球大会发表演讲时说道。

HPC可以说是科技领域最"硬核"的行业之一,代表着计算技术的顶尖水平。长期以来,HPC一直在科研等高精尖领域发挥着重要价值,例如天气预报、基因组测序、地理分析、计算流体动力学 (CFD) 等工作负载方面。在普遍性的行业应用中,HPC通常很难发挥价值,除了应用需求使然,一个重要原因是HPC需要高昂的成本,普通行业的成本投入难以支持。

不过,随着数字化转型在各行各业的深入,随着数据量的快速增长,算力逐渐成为企业的战略性资源,而云端近乎无限的集群算力,使越来越多的行业与场景创新可以通过云端HPC来完成。在可预见的未来,云上HPC的规模扩张成为必然,也正如Adam Selipsky所言——即使是很小的差异也会产生巨大影响。

云上HPC成为未来趋势

在本地构建基础设施来运行HPC工作负载,需要高昂的前期投资,包括冗长的采购周期、监控软硬件更新等持续的管理开销,而当基础设施需要升级时,又面临灵活性受限的挑战。因此,一些行业用户转向在云中运行其HPC工作负载,能够充分利用云提供的安全性、可扩展性和弹性。

从产业效率来看,尽管多数HPC任务目前仍然依赖超算中心和本地硬件,但是,在云端实现高性能、高安全且极具经济效益的高性能计算,可以说是产业创新的大势所趋。根据Hyperion Research数据,2022年底将有18.8%的HPC在云端运行,而2021年,这一数据是12.3%。

看好云上HPC的发展前景,多年来,亚马逊云科技通过持续的投入,目前在HPC领域已经形成了两大核心差异点:芯片、云、存储、软件AI等领域的技术经验的高度融合;以及面向行业需求与用户痛点,进行了大量高度产业指向的软硬件生态。通过高度可定制的 HPC 计算平台,为用户带来多样化的异构计算资源、定制化的计算实例,以及大量低成本的软件,帮助用户解决管理与调度等领域的问题。

自研芯片的进阶之路

自研芯片对亚马逊云科技的云上进阶具有非常关键的作用。自2013年推出Amazon Nitro系统以来,亚马逊云科技已经开发了多个自研芯片,包括五代Nitro系统、致力于为各种工作负载提升性能和优化成本的三代Graviton芯片、用于加速机器学习推理的两代Inferentia芯片,以及用于加速机器学习训练的Trainium芯片。

实践证明,亚马逊云科技更现代化、更节能的半导体处理确保了芯片的快速迭代及交付。每推出一款新的芯片,亚马逊云科技都进一步提升了这些芯片支持的Amazon EC2实例的性能、效率以及更优化的成本。并且,这些实例都针对工作负载需求进行了优化,包括更快的处理速度、更高的内存容量、更快的存储输入/输出(I/O)和更高的网络带宽等。

在2022 re:Invent全球大会上,亚马逊云科技宣布推出三款由自研芯片支持的Amazon Elastic Compute Cloud(Amazon EC2)实例,能够为广泛的工作负载提供更高性价比。三款最新的Amazon EC2新实例分别是:

第一,Amazon EC2 Hpc7g实例采用最新款的Amazon Graviton3E处理器,为HPC工作负载提供极佳的性价比;
第二,Amazon EC2 C7gn配备新一代Amazon Nitro,具有增强的网络处理能力,是目前Amazon EC2网络优化型实例中,提供最高网络带宽和数据包转发性能的实例;
第三,Amazon EC2 Inf2实例,采用最新款的Amazon Inferentia2机器学习加速推理芯片,在Amazon EC2上以最低的延迟与成本,大规模地运行大型的深度学习模型。

亚马逊云科技Amazon EC2副总裁David Brown表示:“从Graviton到Trainium、Inferentia再到Nitro,亚马逊云科技每一代自研芯片都为客户的各种工作负载提供更高的性能、更优化的成本和更高的能效。我们不断推陈出新让客户获得卓越的性价比,这也一直驱动着我们的持续创新。最新推出的Amazon EC2实例为高性能计算、网络密集型工作负载和机器学习推理工作负载提供了显著的性能提升,客户有了更多的实例选择来满足他们的特定需求。”

自研Graviton3E处理器,为HPC打造高性价比

在HPC算力层,亚马逊云科技可提供包括CPU、GPU、Arm芯片在内的多样化异构计算支持,以及定制化的弹性计算实例,满足用户在AI等HPC高发任务中的计算资源需求。除已有的基于 AMD Milan 处理器的 Hpc6a 实例以外,亚马逊云科技推出了基于最新Graviton3E的Hpc7g实例、以及基于Intel处理器的Hpc6id实例,为高性能计算场景提供多种选择。

其中,自研的Arm芯片在打造高性能、高性价比方向,带来了足够的差异化优势。以最新配备了Graviton3E处理器的Hpc7g实例来看,它提供了更多的网络功能,拥有更高的内存带宽和200Gbps的EFA弹性结构适配器网络;与当前一代C6gn实例相比,浮点性能提高了2倍;与当前一代Hpc6a实例相比性能提高了20%,为亚马逊云科技上的高性能计算工作负载提供了超高性价比。

据了解,基于Arm架构的Graviton3E系列芯片,专为支持高性能计算工作负载而设计。相比现有的Graviton系列,有着更高的性能提升,对依赖矢量指令的工作负载的性能提高了35%。

HPC7g 适用于天气预报、生命科学、工程计算等高性能计算场景,这种新的实例类型有多种大小,最多具有64个 vCPU 和 128GiB 内存,这些实例有望在2023年初正式投入商用。

为了适配更多网络密集型工作负载需求,亚马逊云科技还推出了新的 Graviton 3E 实例类型 C7gn,由Graviton3E 处理器提供支持,可支持200Gbps 网络带宽,并提高50%的数据包处理性能。相比于 C7g 实例,C7gn 实例为要求更为严苛的网络密集型工作负载而设计:包含网络虚拟设备(防火墙、虚拟路由器负载均衡器等)、数据分析和紧密耦合的集群计算作业场景。

此外还有EC2 Hpc6id实例,它基于Amazon Nitro系统构建,Hpc6id 实例旨在为数据和内存密集型HPC工作负载提供领先的性价比,具有更高的每核内存带宽、更快的本地 SSD 存储以及带有弹性结构适配器的增强网络。Hpc6id实例提供 200Gbps 弹性结构适配器网络,用于高吞吐量节点间通信,使客户 HPC 工作负载能够大规模运行。

解决云上HPC的“两难”问题

工程师、研究人员和科学家在使用Amazon EC2 网络优化型实例(如 C5n、R5n、M5n 和 C6gn)运行HPC工作负载,这些实例提供了极致的计算能力和服务器之间的高网络带宽,以实现数千个内核处理和交换数据。

虽然这些实例的性能足以满足目前大多数HPC场景,人工智能自动驾驶汽车等新兴应用仍需要HPC优化实例,以扩展到数万个甚至更多的内核,进一步解决难度系数持续增加的问题,并降低HPC工作负载的成本。

针对高性能计算的模拟仿真应用场景,亚马逊云科技在re:Invent2022全球大会还推出了完全托管的计算服务Amazon SimSpace Weaver,基于亚马逊云科技的高性能算力,可以帮助用户构建、操作和运行大规模的空间模拟仿真系统。借助Amazon SimSpace Weaver,用户可以部署空间模拟应用,对具有多个数据点的动态系统进行建模(例如整个城市的交通、场馆内流动的人群或工厂车间的布局),模拟可视化的物理空间,运行沉浸式的训练模型,获得不同情景下的关键指标并做出明智的决策。

基于Amazon SimSpace Weaver,用户可模拟出100万个以上、实时交互的仿真对象,创建比以往更加复杂的环境,同时将模拟仿真系统部署的时间从数年缩短至数月。

写在最后

亚马逊云科技在re:Invent2022全球大会上新发布的芯片,再一次展示了其自研芯片为不同工作负载所能带来的优化空间。特别是在HPC领域的重大突破,能够帮助HPC用户应对不同的工作负载需求:如计算密集型负载、计算和网络密集型负载、数据和内存密集型负载等。最重要的是,这些实例所能提供超高的性价比,有助于进一步推动HPC的普及,这对于未来的算力规模化和优化具有重大意义。

 

推荐器件

更多器件
器件型号 数量 器件厂商 器件描述 数据手册 ECAD模型 风险等级 参考价格 更多信息
STM32F405RGT6V 1 STMicroelectronics High-performance foundation line, Arm Cortex-M4 core with DSP and FPU, 1 Mbyte of Flash memory, 168 MHz CPU, ART Accelerator

ECAD模型

下载ECAD模型
$12.92 查看
ATMEGA64A-AUR 1 Microchip Technology Inc IC MCU 8BIT 64KB FLASH 64TQFP

ECAD模型

下载ECAD模型
$5.79 查看
ATMEGA328P-PU 1 Microchip Technology Inc IC MCU 8BIT 32KB FLASH 28DIP

ECAD模型

下载ECAD模型
$3.98 查看

相关推荐

电子产业图谱

与非网资深行业分析师。主要关注人工智能、智能消费电子等领域。电子科技领域专业媒体十余载,善于纵深洞悉行业趋势。欢迎交流~