黄仁勋访华带回“大礼包”H200解禁 Groq蓄势 Cerebras上市英伟达算力帝国迎来新变局

2026年5月中旬，半导体圈有两件大事几乎同时发生：

第一件：英伟达CEO黄仁勋访华，路透社爆料——约10家中国科技公司获准采购H200芯片，包括阿里、腾讯、字节、京东等，每家公司最高可采购约7.5万颗。联想、富士康等经销商也获批经销资格。英伟达当天收盘涨约4%。

第二件：晶圆级芯片公司Cerebras在纳斯达克上市，IPO定价185美元（高出指导区间），首日最高飙到386美元，市值一度突破千亿美元。

一边是老牌巨头对华出口松绑，一边是新型算力架构受到资本热捧。英伟达的算力帝国，正面临哪些新变量？

今天我们就用华泰证券这份最新研报，把这三件事串起来讲透。

一、H200对华出口：不是“全面放开”，是“限量投喂”

先说清楚：H200不是最新产品。它基于台积电5nm工艺，配备141GB HBM3e，内存带宽4.8TB/s，提供约4P FFP8稀疏算力。相比英伟达自家的Rubin架构，H200属于N-2代产品。

但即便如此，它对中国市场仍属于“高端货”。美国BIS的出口管制核心指标是：总处理性能（TPP）低于21,000，且总DRAM带宽低于6,500GB/s。H200刚好卡在可出口的边界上。

这次获准采购的公司约10家，每家最多7.5万颗。7.5万颗是什么概念？以单颗H200约4万美元估算，一家公司采购上限就是30亿美元。阿里、腾讯、字节这几家加起来，可能贡献上百亿美元订单。

华泰证券的观点很明确：H200更多是当前国内训练算力缺口下的“阶段性选择”。长期来看，中国推动国产替代的方向不会变。但短期而言，这笔订单对英伟达的业绩是实打实的利好。

二、真正值得关注的是“低时延推理芯片”：Groq与Cerebras

训练芯片是“造脑子”，推理芯片是“用脑子”。

Agentic AI（代理式人工智能）浪潮正在开启——AI不仅要回答问题，还要自主执行任务、调用工具、完成复杂流程。这对低时延推理提出了极高要求。

传统GPU架构（包括H200）在推理时，数据需要在HBM和计算单元之间频繁搬运，时延天然较高。而新一代低时延芯片，正在用两种完全不同技术路线来突破：

路线1：Groq的“SRAM取代HBM”

Groq的LPU（语言处理单元）不搭载HBM，而是用了约500MB片上SRAM。SRAM速度极快，功耗更低，但容量小、成本高。其FP8算力约1.2P，内存带宽约150TB/s（远高于H200的4.8TB/s），Scale-up带宽约2.5TB/s。

关键是：按照BIS出口管制规则，限制的是DRAM带宽，而Groq用的是SRAM，不属于限制范围。这意味着Groq芯片对华出口的实质性障碍远小于H200这类传统GPU。

华泰证券判断：低时延推理芯片供给相对稀缺，在Agentic AI与企业级推理需求快速增长的背景下，相关产品更具刚需性。英伟达正推进面向中国市场的Groq芯片方案（虽然黄仁勋曾在采访中否认，但The Information有过相关报道）。

路线2：Cerebras的“晶圆级芯片”

5月14日上市的Cerebras，走的是另一条路——整张晶圆不做切割，直接做成一颗芯片。

第三代晶圆级引擎WSE-3：台积电5nm工艺，集成约4万亿晶体管，44GB片上内存，带宽高达21PB/s，约90万个计算核心。

做个对比：英伟达LPX机柜（256颗Groq互联）提供128GB SRAM、40PB/s内存带宽、640TB/s Scale-up互联带宽。Cerebras单颗芯片的数据已经接近一个机柜集群的性能。

资本市场的反应极其热烈：IPO定价185美元，首日最高冲到386美元，估值从550亿美元瞬间逼近千亿。OpenAI已宣布与Cerebras达成750MW超低时延AI算力合作，2028年前分阶段上线。AWS也与Cerebras达成战略合作，将其与Trainium芯片共建分离式推理架构。

但华泰证券也提出了四点疑虑：

良率与成本：整张晶圆只要有一个坏点，整颗芯片就可能报废。虽然Cerebras设计了冗余机制，但制造难度和成本仍远高于传统芯片。

片上存储容量：44GB片上内存对于未来的超大参数模型可能不够用。

散热问题：晶圆级芯片的功耗极高，散热是工程噩梦。

晶圆间互联：单张晶圆不够用怎么办？多张晶圆如何高速互联？目前还没有成熟方案。

三、英伟达的基本盘：Capex上修，景气度无忧

尽管面临新型架构的挑战，但英伟达的基本面依然强劲。

华泰证券维持对英伟达的盈利预测：

财年	营收（亿美元）	Non-GAAP净利润（亿美元）	调整后EPS（美元）
2026（实际）	2,159	1,170	4.83
2027E	4,035	2,284	9.43
2028E	5,135	2,891	11.94
2029E	6,052	3,389	13.99

对应调整后PE：2027年25倍、2028年19.8倍、2029年16.9倍。目标价310美元，给予33x FY27E PE，维持“买入”评级。

核心逻辑很清晰：全球云大厂Capex持续上修，2026年九大云服务商合计资本支出已上修至8300亿美元，年增79%。英伟达的Blackwell和Rubin订单今年将加速放量，CUDA生态护城河短期内无人能撼。

四、对国内产业链的启示

把这三件事放在一起，对国内半导体投资有几点启示：

1. 短期：H200对华出口是“双刃剑”

一方面，国产AI芯片厂商（华为昇腾、寒武纪、沐曦、海光等）会面临更直接的竞争——毕竟H200性能摆在那里，客户多了一个选择。但另一方面，H200的“限量投喂”恰恰说明美国不会完全断供，这对国内供应链的极端压力测试有所缓解。

2. 中期：低时延推理芯片是下一个战场

Groq和Cerebras的受关注，反映出市场对推理算力的焦虑正在超过训练算力。国内的AI芯片公司如果能在低时延推理架构上有所突破（比如通过存内计算、Chiplet等方式），有望在Agentic AI浪潮中分到一杯羹。

3. 长期：异构计算是终局

英伟达自己也在布局GPU/ASIC/CPU/CXL/低时延推理芯片的协同体系。未来的数据中心不会是单一架构打天下，而是各种专用芯片各司其职。这对国内芯片公司来说，意味着不必在通用GPU上与英伟达正面硬刚，可以在某个细分领域做深做透。

4. 国产替代的节奏不会因H200解禁而逆转

阿里、腾讯一边采购H200，一边也在加码国产芯片。腾讯高管明确表示“下半年将有更多国产芯片陆续投入使用”。短期用H200填缺口，长期用国产芯片替代——这个双轨策略不会改变。

五、风险提示（报告原文）

技术落地缓慢：Cerebras等新型架构从实验室到大规模商用，仍面临良率、成本、散热等工程挑战

中美贸易摩擦：出口管制政策随时可能调整，Groq方案是否能真正对华出口仍存在不确定性

芯片需求不及预期：如果AI应用商业化慢于预期，算力投资可能降温

写在最后

英伟达依然是这个时代的算力之王。但王座的周围，已经出现了新的挑战者——不是在通用GPU上正面硬刚，而是在低时延推理、晶圆级计算等新维度上另辟蹊径。

H200解禁、Groq蓄势、Cerebras上市——这三件事放在一周内发生，绝不是巧合。它标志着AI算力正在从“训练优先”转向“推理优先”，从“通用为王”转向“异构共存”。

对于投资者来说，与其纠结“英伟达还能不能涨”，不如多想想：下一个算力架构的颠覆性创新，会来自哪里？

责声明：本文基于华泰证券《英伟达（NVDA）：关注Groq芯片对华出口与Cerebras晶圆级芯片趋势》研究报告整理，内容仅为客观转述，不构成任何投资建议。市场有风险，投资需谨慎。

黄仁勋访华带回“大礼包”H200解禁 Groq蓄势 Cerebras上市 英伟达算力帝国迎来新变局