加入星计划,您可以享受以下权益:

  • 创作内容快速变现
  • 行业影响力扩散
  • 作品版权保护
  • 300W+ 专业用户
  • 1.5W+ 优质创作者
  • 5000+ 长期合作伙伴
立即加入
  • 正文
  • 推荐器件
  • 相关推荐
  • 电子产业图谱
申请入驻 产业图谱

当今全球算力巅峰,华为 Atlas 900 AI 训练集群

2019/09/19
73
阅读需 22 分钟
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

与非网 9 月 19 日讯,昨日消息,华为全联接 2019 大会上,华为副董事长胡厚崑发布了 Atlas 900 AI 训练集群。此次发布的 Atlas 900 AI 训练集群由数千颗昇腾 910 AI 处理器互联构成,是当前全球最快的 AI 训练集群,代表了当今全球的算力巅峰。其总算力达到 256P~1024P FLOPS @FP16,相当于 50 万台 PC 的计算能力。

华为副董事长胡厚崑发表《共创智能新高度》主题演讲

四大举措布局计算战略

计算是人类认知世界的一种模式。从大型机到个人计算机,从智能手机到可穿戴设备,计算能力日益成为人类能力的延伸。同时,计算模式也在不断演进,基于统计的计算模式将逐渐成为主流。预计 5 年后,AI 计算所消耗的算力,将占到算力消耗总量的 80%以上,计算正在进入一个新的智能时代。

华为副董事长胡厚崑表示,“我们面临的是一个 2 万亿美元的计算产业大蓝海,华为坚定不移地投入计算产业,通过对架构创新的突破、对全场景处理器的投资、坚持有所为有所不为的商业策略,以及构建开放生态来布局战略。”

第一,架构创新。投资基础研究,推出达芬奇架构,用创新的处理器架构来匹配算力的增速。

第二,投资全场景处理器族,包括面向通用计算的鲲鹏系列,面向 AI 计算的昇腾系列,面向智能终端的麒麟系列,以及面向智慧屏的鸿鹄系列等。

第三,有所为有所不为的商业策略。华为不直接对外销售处理器,以云服务面向客户,以部件为主面向合作伙伴,优先支持合作伙伴发展整机。

第四,构建开放生态。未来 5 年,继续投入 15 亿美元,再汇聚 500 万开发者,使能全球合作伙伴开发应用及解决方案。

AI 算力领先

Atlas 900 AI 训练集群采用业界单芯片算力最强的昇腾 910 AI 处理器,每颗昇腾 910 AI 处理器内置 32 个达芬奇 AI Core,单芯片提供比业界高一倍的算力。Atlas 900 AI 训练集群将数千颗昇腾 910 AI 处理器互联,打造业界第一的算力集群。

昇腾 910 AI 处理器采用 SoC 设计,集成“AI 算力、通用算力、高速大带宽 I/O”,大幅度卸载 Host CPU 的数据预处理任务,充分提升训练效率。

最佳集群网络

Atlas 900 AI 训练集群采用“HCCS、 PCIe 4.0、100G 以太”三类高速互联方式,百 TB 全互联无阻塞专属参数同步网络,降低网络时延,梯度同步时延缩短 10~70%。

在 AI 服务器内部,昇腾 910 AI 处理器之间通过 HCCS 高速总线互联;昇腾 910 AI 处理器和 CPU 之间以最新的 PCIe 4.0(速率 16Gb/s)技术互联,其速率是业界主流采用的 PCIe 3.0(8.0Gb/s)技术的两倍,使得数据传输更加快速和高效。在集群层面,采用面向数据中心的 CloudEngine 8800 系列交换机,提供单端口 100Gbps 的交换速率,将集群内的所有 AI 服务器接入高速交换网络。

独创 iLossless 智能无损交换算法,对集群内的网络流量进行实时的学习训练,实现网络 0 丢包与 E2E μs 级时延。

系统级调优

Atlas 900 AI 训练集群通过华为集合通信库和作业调度平台,整合 HCCS、 PCIe 4.0 和 100G RoCE 三种高速接口,充分释放昇腾 910 AI 处理器的强大性能。

华为集合通信库提供训练网络所需的分布式并行库,通信库+网络拓扑+训练算法进行系统级调优,实现集群线性度>80%,极大提升了作业调度效率。

散热系统

传统数据中心多以风冷技术对设备进行散热,但在人工智能时代传统数据中心却面临非常大的挑战。高功耗器件比如 CPU 和 AI 芯片带来更大的热岛效应要求更高效的冷却方式。液冷技术可以满足数据中心高功率、高密部署、低 PUE 的超高需求。

Atlas 900 AI 训练集群采用全液冷方案,创新性设计业界最强柜级密闭绝热技术,支撑>95%液冷占比。单机柜支持高达 50kW 超高散热功耗,实现 PUE<1.1 的极致数据中心能源效率。

另外,在空间节省方面,与 8kW 风冷机柜相比,节省机房空间 79%。极致的液冷散热技术满足了高功率、高密设备部署、低 PUE 的需求,极大地降低了客户的 TCO。

发布全球最快的 AI 训练集群:Atlas 900

这款产品汇聚了华为十多年的技术沉淀,由数千颗昇腾处理器组成。在衡量 AI 计算能力的金标准 ResNet-50 图片分类模型下,Atlas 900 只需 59.8 秒就完成了训练,在同等精度下比原来的世界纪录快 10 秒。

Atlas 900 的强大算力,可广泛应用于科学研究与商业创新,比如天文探索、气象预测、自动驾驶、石油勘探等领域。为了让各行各业获取超强算力,华为将 Atlas 900 部署到云上,推出华为云 EI 集群服务,并以极优惠的价格,面向全球科研机构和大学,即刻开放申请使用。

在本次大会上,中国工程院院士、鹏城实验室主任高文院士,分享了鹏城实验室与华为的合作,力求共同打造中国首个动态进化的 E 级 AI 超算系统,构建新一代人工智能基础研究创新平台。华为云业务总裁郑叶来,则从商业应用的角度,基于华为云在 10 多个行业、500 多个项目的实践,指出行业 AI 正在跨越商用裂谷,成为重塑企业数字化转型的关键驱动。

“这是计算产业新的大航海时代,我们期待的是千帆竞发,而不是独舟奋进。我们期望和各行各业的伙伴共同努力,抓住历史机遇,共创智能新高度。” 胡厚崑最后强调。

HUAWEI CONNECT 2019 作为华为自办的面向 ICT 产业的全球性年度旗舰大会,于 2019 年 9 月 18 日 -20 日在上海隆重举行。本届大会以“共创智能新高度”为主题,旨在搭建一个开放、合作、共享的平台,与客户伙伴一起共同探讨如何把握新机遇创造智能未来。

与非网整理自网络!

推荐器件

更多器件
器件型号 数量 器件厂商 器件描述 数据手册 ECAD模型 风险等级 参考价格 更多信息
SN74LVC1G97DCKRE4 1 Texas Instruments Configurable Multiple-Function Gate 6-SC70 -40 to 125

ECAD模型

下载ECAD模型
暂无数据 查看
SN74HC14DR 1 Texas Instruments 6-ch, 2-V to 6-V inverters with Schmitt-Trigger inputs 14-SOIC -40 to 85

ECAD模型

下载ECAD模型
$0.21 查看
SY89113UMY 1 Microchip Technology Inc 89113 SERIES, LOW SKEW CLOCK DRIVER, 12 TRUE OUTPUT(S), 0 INVERTED OUTPUT(S), QCC44
$8.97 查看
华为

华为

华为创立于1987年,是全球领先的ICT(信息与通信)基础设施和智能终端提供商。目前华为约有19.7万员工,业务遍及170多个国家和地区,服务全球30多亿人口。华为致力于把数字世界带入每个人、每个家庭、每个组织,构建万物互联的智能世界:让无处不在的联接,成为人人平等的权利,成为智能世界的前提和基础;为世界提供最强算力,让云无处不在,让智能无所不及;所有的行业和组织,因强大的数字平台而变得敏捷、高效、生机勃勃;通过AI重新定义体验,让消费者在家居、出行、办公、影音娱乐、运动健康等全场景获得极致的个性化智慧体验。

华为创立于1987年,是全球领先的ICT(信息与通信)基础设施和智能终端提供商。目前华为约有19.7万员工,业务遍及170多个国家和地区,服务全球30多亿人口。华为致力于把数字世界带入每个人、每个家庭、每个组织,构建万物互联的智能世界:让无处不在的联接,成为人人平等的权利,成为智能世界的前提和基础;为世界提供最强算力,让云无处不在,让智能无所不及;所有的行业和组织,因强大的数字平台而变得敏捷、高效、生机勃勃;通过AI重新定义体验,让消费者在家居、出行、办公、影音娱乐、运动健康等全场景获得极致的个性化智慧体验。收起

查看更多

相关推荐

电子产业图谱