• 正文
  • 相关推荐
申请入驻 产业图谱

黄仁勋访华带回“大礼包”H200解禁 Groq蓄势 Cerebras上市 英伟达算力帝国迎来新变局

7小时前
602
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

2026年5月中旬,半导体圈有两件大事几乎同时发生:

第一件英伟达CEO黄仁勋访华,路透社爆料——约10家中国科技公司获准采购H200芯片,包括阿里、腾讯、字节、京东等,每家公司最高可采购约7.5万颗。联想、富士康等经销商也获批经销资格。英伟达当天收盘涨约4%。

第二件晶圆芯片公司Cerebras在纳斯达克上市,IPO定价185美元(高出指导区间),首日最高飙到386美元,市值一度突破千亿美元。

一边是老牌巨头对华出口松绑,一边是新型算力架构受到资本热捧。英伟达的算力帝国,正面临哪些新变量?

今天我们就用华泰证券这份最新研报,把这三件事串起来讲透。

一、H200对华出口:不是“全面放开”,是“限量投喂”

先说清楚:H200不是最新产品。它基于台积电5nm工艺,配备141GB HBM3e,内存带宽4.8TB/s,提供约4P FFP8稀疏算力。相比英伟达自家的Rubin架构,H200属于N-2代产品。

但即便如此,它对中国市场仍属于“高端货”。美国BIS的出口管制核心指标是:总处理性能(TPP)低于21,000,且总DRAM带宽低于6,500GB/s。H200刚好卡在可出口的边界上。

这次获准采购的公司约10家,每家最多7.5万颗。7.5万颗是什么概念?以单颗H200约4万美元估算,一家公司采购上限就是30亿美元。阿里、腾讯、字节这几家加起来,可能贡献上百亿美元订单。

华泰证券的观点很明确:H200更多是当前国内训练算力缺口下的“阶段性选择”。长期来看,中国推动国产替代的方向不会变。但短期而言,这笔订单对英伟达的业绩是实打实的利好。

二、真正值得关注的是“低时延推理芯片”:Groq与Cerebras

训练芯片是“造脑子”,推理芯片是“用脑子”。

Agentic AI(代理式人工智能)浪潮正在开启——AI不仅要回答问题,还要自主执行任务、调用工具、完成复杂流程。这对低时延推理提出了极高要求。

传统GPU架构(包括H200)在推理时,数据需要在HBM和计算单元之间频繁搬运,时延天然较高。而新一代低时延芯片,正在用两种完全不同技术路线来突破:

路线1:Groq的“SRAM取代HBM”

Groq的LPU(语言处理单元)不搭载HBM,而是用了约500MB片上SRAM。SRAM速度极快,功耗更低,但容量小、成本高。其FP8算力约1.2P,内存带宽约150TB/s(远高于H200的4.8TB/s),Scale-up带宽约2.5TB/s。

关键是:按照BIS出口管制规则,限制的是DRAM带宽,而Groq用的是SRAM,不属于限制范围。这意味着Groq芯片对华出口的实质性障碍远小于H200这类传统GPU。

华泰证券判断:低时延推理芯片供给相对稀缺,在Agentic AI与企业级推理需求快速增长的背景下,相关产品更具刚需性。英伟达正推进面向中国市场的Groq芯片方案(虽然黄仁勋曾在采访中否认,但The Information有过相关报道)。

路线2:Cerebras的“晶圆级芯片”

5月14日上市的Cerebras,走的是另一条路——整张晶圆不做切割,直接做成一颗芯片

第三代晶圆级引擎WSE-3:台积电5nm工艺,集成约4万亿晶体管,44GB片上内存,带宽高达21PB/s,约90万个计算核心。

做个对比:英伟达LPX机柜(256颗Groq互联)提供128GB SRAM、40PB/s内存带宽、640TB/s Scale-up互联带宽。Cerebras单颗芯片的数据已经接近一个机柜集群的性能。

资本市场的反应极其热烈:IPO定价185美元,首日最高冲到386美元,估值从550亿美元瞬间逼近千亿。OpenAI已宣布与Cerebras达成750MW超低时延AI算力合作,2028年前分阶段上线。AWS也与Cerebras达成战略合作,将其与Trainium芯片共建分离式推理架构。

但华泰证券也提出了四点疑虑:

良率与成本:整张晶圆只要有一个坏点,整颗芯片就可能报废。虽然Cerebras设计了冗余机制,但制造难度和成本仍远高于传统芯片。

片上存储容量:44GB片上内存对于未来的超大参数模型可能不够用。

散热问题:晶圆级芯片的功耗极高,散热是工程噩梦。

晶圆间互联:单张晶圆不够用怎么办?多张晶圆如何高速互联?目前还没有成熟方案。

三、英伟达的基本盘:Capex上修,景气度无忧

尽管面临新型架构的挑战,但英伟达的基本面依然强劲。

华泰证券维持对英伟达的盈利预测:

财年 营收(亿美元) Non-GAAP净利润(亿美元) 调整后EPS(美元)
2026(实际) 2,159 1,170 4.83
2027E 4,035 2,284 9.43
2028E 5,135 2,891 11.94
2029E 6,052 3,389 13.99

对应调整后PE:2027年25倍、2028年19.8倍、2029年16.9倍。目标价310美元,给予33x FY27E PE,维持“买入”评级。

核心逻辑很清晰:全球云大厂Capex持续上修,2026年九大云服务商合计资本支出已上修至8300亿美元,年增79%。英伟达的Blackwell和Rubin订单今年将加速放量,CUDA生态护城河短期内无人能撼。

四、对国内产业链的启示

把这三件事放在一起,对国内半导体投资有几点启示:

1. 短期:H200对华出口是“双刃剑”

一方面,国产AI芯片厂商(华为昇腾、寒武纪、沐曦、海光等)会面临更直接的竞争——毕竟H200性能摆在那里,客户多了一个选择。但另一方面,H200的“限量投喂”恰恰说明美国不会完全断供,这对国内供应链的极端压力测试有所缓解。

2. 中期:低时延推理芯片是下一个战场

Groq和Cerebras的受关注,反映出市场对推理算力的焦虑正在超过训练算力。国内的AI芯片公司如果能在低时延推理架构上有所突破(比如通过存内计算、Chiplet等方式),有望在Agentic AI浪潮中分到一杯羹。

3. 长期:异构计算是终局

英伟达自己也在布局GPU/ASIC/CPU/CXL/低时延推理芯片的协同体系。未来的数据中心不会是单一架构打天下,而是各种专用芯片各司其职。这对国内芯片公司来说,意味着不必在通用GPU上与英伟达正面硬刚,可以在某个细分领域做深做透。

4. 国产替代的节奏不会因H200解禁而逆转

阿里、腾讯一边采购H200,一边也在加码国产芯片。腾讯高管明确表示“下半年将有更多国产芯片陆续投入使用”。短期用H200填缺口,长期用国产芯片替代——这个双轨策略不会改变。

五、风险提示(报告原文)

技术落地缓慢:Cerebras等新型架构从实验室到大规模商用,仍面临良率、成本、散热等工程挑战

中美贸易摩擦:出口管制政策随时可能调整,Groq方案是否能真正对华出口仍存在不确定性

芯片需求不及预期:如果AI应用商业化慢于预期,算力投资可能降温

写在最后

英伟达依然是这个时代的算力之王。但王座的周围,已经出现了新的挑战者——不是在通用GPU上正面硬刚,而是在低时延推理、晶圆级计算等新维度上另辟蹊径。

H200解禁、Groq蓄势、Cerebras上市——这三件事放在一周内发生,绝不是巧合。它标志着AI算力正在从“训练优先”转向“推理优先”,从“通用为王”转向“异构共存”。

对于投资者来说,与其纠结“英伟达还能不能涨”,不如多想想:下一个算力架构的颠覆性创新,会来自哪里?

责声明:本文基于华泰证券《英伟达(NVDA):关注Groq芯片对华出口与Cerebras晶圆级芯片趋势》研究报告整理,内容仅为客观转述,不构成任何投资建议。市场有风险,投资需谨慎。

 

相关推荐