• 正文
  • 相关推荐
申请入驻 产业图谱

华为910C量产在即,并将于下半年发布昇腾920实现对英伟达H20的国产替代

05/16 14:45
2.5万
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

在当今这个被AI重塑的时代,算力早已成为推动创新发展的核心动力。毫不夸张地说,算力就是生产力,谁掌握了强大的算力,谁就能在AI赛道上抢占先机,引领未来科技发展的潮流。然而,对于国内的 AI 产业而言,一场算力危机正悄然降临。

2025年4月15日,美国商务部宣布对出口至中国的英伟达H20、AMD MI308等AI芯片实施无限期出口许可限制。该操作直接戳中行业痛点,让国内AI产业陷入“缺芯”困局。

要知道,虽然H20性能仅有英伟达H100芯片的三分之一,但却是中国公司目前合法能买到的,性能最强的AI芯片。如今,这一关键来源被美国无情地掐断,使得国内AI产业面临着巨大的挑战。

阿里、腾讯、字节跳动等科技巨头首当其冲,此前它们订购的160亿美元H20芯片,占了英伟达全球AI芯片销售额的相当比例,如今订单却化为泡影。这些科技巨头在AI领域的布局广泛,对算力的需求极为庞大,H20芯片的断供,无疑让它们的AI项目进展受到了极大的阻碍。

算力短缺所带来的影响,绝不仅仅局限于这些科技巨头,而是波及到了整个 AI 产业。更为严峻的是,算力短缺还可能让我们在全球 AI 竞争的赛道上被远远甩开。

不过好消息也来了!外媒爆料,多位消息人士证实:华为计划下个月就开始向国内客户大规模出货昇腾910C,部分产品甚至已经悄然发货。更重磅的是,华为预计在2025年下半年正式推出下一代AI芯片——昇腾920,并且今年下半年就将开启量产。

从外媒报道的知情人士内容看,昇腾910C采用了中芯国际的7nm工艺制造,通过先进的chiplets双芯片整合封装技术,将两颗昇腾910B处理器巧妙地集成到一个封装里 ,实现了算力的跨越式突破。这种创新的设计,不仅突破了单芯片物理限制,还将昇腾910B的256个AICore人工智能核心扩展至512个,使得单卡FP16运算性能跃升至640 TFLOPS,较英伟达H100提升20%,达到H200性能的80%,计算能力和内存容量相对于910B提升了一倍。

不仅如此,昇腾910C在推理任务中的表现也十分出色,性能达到英伟达H100的60%-80%,能够高效地处理各种复杂的AI任务。而且,它还对各种AI工作负载数据支持更好,无论是深度学习、自然语言处理,还是计算机视觉等领域,都能发挥出强大的算力优势,为AI应用的开发和部署提供了坚实的硬件基础。

在功耗控制方面,昇腾910C同样延续了华为的技术优势。在310瓦功耗条件下,其算力密度较H100提升40%,较H200降低25%。这意味着,采用该芯片的数据中心在同等算力需求下,能耗成本可缩减30%以上,既能满足大规模AI计算的需求,又能符合全球碳中和战略。

更值得一提的是,昇腾910C的Scale Out扩展带宽已与英伟达最新GB200持平,彻底突破了国产芯片集群互联的技术瓶颈。

从成本角度来看,昇腾910C也展现出了卓越的性价比。当前单颗售价约2万元,仅为英伟达H100市场价的20%,在性能大幅提升的同时,成本却大幅降低,这无疑将大大降低国内AI企业的研发和运营成本,提高它们在市场中的竞争力。

在华为昇腾910C即将大规模出货的利好消息之后,一个更加振奋人心的消息传来:华为预计在2025年下半年正式推出下一代AI芯片——昇腾920,并且今年下半年就将开启量产。

昇腾920将基于中芯国际的6nm(N+3 节点)工艺技术打造,单芯片算力将提供超过900 TFLOPS的BF16精度算力性能,同时内存将升级到HBM3,单卡提供4000GB/s的带宽。与之前的昇腾910C相比,昇腾920针对Transformer和MoE模型进行了进一步优化,效率提高了30%-40%,整体性能也大幅超越了英伟达H20(BF16算力为148 TFLOPS)。除此之外,昇腾920支持PCIe5.0及下一代高吞吐互联协议,这将使得昇腾920和其他硬件配合得更默契。

值得一提的是,除了昇腾920,华为还展示了其AI算力集群解决方案CloudMatrix 384(简称“CM384”),凭借其颠覆性的系统架构设计与全栈技术创新,在多项关键指标上实现对英伟达旗舰产品GB200 NVL72的超越。

据半导体研究机构SemiAnalysis披露,华为CM384基于384颗昇腾芯片构建,通过全互连拓扑架构实现芯片间高效协同,可提供高达300 PFLOPs的密集BF16算力,接近达到英伟达GB200 NVL72系统算力的两倍。此外,CM384在内存容量和带宽方面同样占据优势,总内存容量超出英伟达方案3.6倍,内存带宽也达到2.1倍,为大规模AI训练和推理提供了更高效的硬件支持。

对此,SemiAnalysis认为,尽管单颗昇腾芯片性能约为英伟达Blackwell GPU的三分之一,但是华为通过规模化系统设计,成功实现整体算力跃升,并在超大规模模型训练、实时推理等场景中展现更强竞争力。

需要指出的是,华为CM384性能及各项指标上的领先,主要凭借的是384颗昇腾芯片数量上的优势,而英伟达GB200 NVL72则只有144颗Blackwell GPU,因此华为CM384在整体占用空间和功耗上也将会更高。

据相关数据显示,CM384系统机柜密度达到42kW/rack,是英伟达GB200方案的1.7倍,这对数据中心供电和散热提出更高要求。

不过,此时正值美国进一步收紧对华AI芯片的出口管制之际,华为昇腾920及CM384的推出将有望实现对于无法继续对华出口的英伟达H20、AMD MI308等AI芯片及相关AI集群系统的替代,为国内AI产业的自主发展提供了有力保障。

据相关消息称,华为这套完全自主的解决方案已获得字节跳动、科大讯飞等企业的批量订单。某云计算厂商技术负责人透露,其正在测试的昇腾920集群在千卡规模下训练稳定性突破28天,基本达到CUDA生态的工程化水平。

华为

华为

华为创立于1987年,是全球领先的ICT(信息与通信)基础设施和智能终端提供商。目前华为约有19.7万员工,业务遍及170多个国家和地区,服务全球30多亿人口。华为致力于把数字世界带入每个人、每个家庭、每个组织,构建万物互联的智能世界:让无处不在的联接,成为人人平等的权利,成为智能世界的前提和基础;为世界提供最强算力,让云无处不在,让智能无所不及;所有的行业和组织,因强大的数字平台而变得敏捷、高效、生机勃勃;通过AI重新定义体验,让消费者在家居、出行、办公、影音娱乐、运动健康等全场景获得极致的个性化智慧体验。

华为创立于1987年,是全球领先的ICT(信息与通信)基础设施和智能终端提供商。目前华为约有19.7万员工,业务遍及170多个国家和地区,服务全球30多亿人口。华为致力于把数字世界带入每个人、每个家庭、每个组织,构建万物互联的智能世界:让无处不在的联接,成为人人平等的权利,成为智能世界的前提和基础;为世界提供最强算力,让云无处不在,让智能无所不及;所有的行业和组织,因强大的数字平台而变得敏捷、高效、生机勃勃;通过AI重新定义体验,让消费者在家居、出行、办公、影音娱乐、运动健康等全场景获得极致的个性化智慧体验。收起

查看更多

相关推荐