2026年5月中旬,半导体圈有两件大事几乎同时发生:
第一件:英伟达CEO黄仁勋访华,路透社爆料——约10家中国科技公司获准采购H200芯片,包括阿里、腾讯、字节、京东等,每家公司最高可采购约7.5万颗。联想、富士康等经销商也获批经销资格。英伟达当天收盘涨约4%。
第二件:晶圆级芯片公司Cerebras在纳斯达克上市,IPO定价185美元(高出指导区间),首日最高飙到386美元,市值一度突破千亿美元。
一边是老牌巨头对华出口松绑,一边是新型算力架构受到资本热捧。英伟达的算力帝国,正面临哪些新变量?
今天我们就用华泰证券这份最新研报,把这三件事串起来讲透。
一、H200对华出口:不是“全面放开”,是“限量投喂”
先说清楚:H200不是最新产品。它基于台积电5nm工艺,配备141GB HBM3e,内存带宽4.8TB/s,提供约4P FFP8稀疏算力。相比英伟达自家的Rubin架构,H200属于N-2代产品。
但即便如此,它对中国市场仍属于“高端货”。美国BIS的出口管制核心指标是:总处理性能(TPP)低于21,000,且总DRAM带宽低于6,500GB/s。H200刚好卡在可出口的边界上。
这次获准采购的公司约10家,每家最多7.5万颗。7.5万颗是什么概念?以单颗H200约4万美元估算,一家公司采购上限就是30亿美元。阿里、腾讯、字节这几家加起来,可能贡献上百亿美元订单。
华泰证券的观点很明确:H200更多是当前国内训练算力缺口下的“阶段性选择”。长期来看,中国推动国产替代的方向不会变。但短期而言,这笔订单对英伟达的业绩是实打实的利好。
二、真正值得关注的是“低时延推理芯片”:Groq与Cerebras
训练芯片是“造脑子”,推理芯片是“用脑子”。
Agentic AI(代理式人工智能)浪潮正在开启——AI不仅要回答问题,还要自主执行任务、调用工具、完成复杂流程。这对低时延推理提出了极高要求。
传统GPU架构(包括H200)在推理时,数据需要在HBM和计算单元之间频繁搬运,时延天然较高。而新一代低时延芯片,正在用两种完全不同技术路线来突破:
路线1:Groq的“SRAM取代HBM”
Groq的LPU(语言处理单元)不搭载HBM,而是用了约500MB片上SRAM。SRAM速度极快,功耗更低,但容量小、成本高。其FP8算力约1.2P,内存带宽约150TB/s(远高于H200的4.8TB/s),Scale-up带宽约2.5TB/s。
关键是:按照BIS出口管制规则,限制的是DRAM带宽,而Groq用的是SRAM,不属于限制范围。这意味着Groq芯片对华出口的实质性障碍远小于H200这类传统GPU。
华泰证券判断:低时延推理芯片供给相对稀缺,在Agentic AI与企业级推理需求快速增长的背景下,相关产品更具刚需性。英伟达正推进面向中国市场的Groq芯片方案(虽然黄仁勋曾在采访中否认,但The Information有过相关报道)。
路线2:Cerebras的“晶圆级芯片”
5月14日上市的Cerebras,走的是另一条路——整张晶圆不做切割,直接做成一颗芯片。
第三代晶圆级引擎WSE-3:台积电5nm工艺,集成约4万亿晶体管,44GB片上内存,带宽高达21PB/s,约90万个计算核心。
做个对比:英伟达LPX机柜(256颗Groq互联)提供128GB SRAM、40PB/s内存带宽、640TB/s Scale-up互联带宽。Cerebras单颗芯片的数据已经接近一个机柜集群的性能。
资本市场的反应极其热烈:IPO定价185美元,首日最高冲到386美元,估值从550亿美元瞬间逼近千亿。OpenAI已宣布与Cerebras达成750MW超低时延AI算力合作,2028年前分阶段上线。AWS也与Cerebras达成战略合作,将其与Trainium芯片共建分离式推理架构。
但华泰证券也提出了四点疑虑:
良率与成本:整张晶圆只要有一个坏点,整颗芯片就可能报废。虽然Cerebras设计了冗余机制,但制造难度和成本仍远高于传统芯片。
片上存储容量:44GB片上内存对于未来的超大参数模型可能不够用。
散热问题:晶圆级芯片的功耗极高,散热是工程噩梦。
晶圆间互联:单张晶圆不够用怎么办?多张晶圆如何高速互联?目前还没有成熟方案。
三、英伟达的基本盘:Capex上修,景气度无忧
尽管面临新型架构的挑战,但英伟达的基本面依然强劲。
华泰证券维持对英伟达的盈利预测:
| 财年 | 营收(亿美元) | Non-GAAP净利润(亿美元) | 调整后EPS(美元) |
|---|---|---|---|
| 2026(实际) | 2,159 | 1,170 | 4.83 |
| 2027E | 4,035 | 2,284 | 9.43 |
| 2028E | 5,135 | 2,891 | 11.94 |
| 2029E | 6,052 | 3,389 | 13.99 |
对应调整后PE:2027年25倍、2028年19.8倍、2029年16.9倍。目标价310美元,给予33x FY27E PE,维持“买入”评级。
核心逻辑很清晰:全球云大厂Capex持续上修,2026年九大云服务商合计资本支出已上修至8300亿美元,年增79%。英伟达的Blackwell和Rubin订单今年将加速放量,CUDA生态护城河短期内无人能撼。
四、对国内产业链的启示
把这三件事放在一起,对国内半导体投资有几点启示:
1. 短期:H200对华出口是“双刃剑”
一方面,国产AI芯片厂商(华为昇腾、寒武纪、沐曦、海光等)会面临更直接的竞争——毕竟H200性能摆在那里,客户多了一个选择。但另一方面,H200的“限量投喂”恰恰说明美国不会完全断供,这对国内供应链的极端压力测试有所缓解。
2. 中期:低时延推理芯片是下一个战场
Groq和Cerebras的受关注,反映出市场对推理算力的焦虑正在超过训练算力。国内的AI芯片公司如果能在低时延推理架构上有所突破(比如通过存内计算、Chiplet等方式),有望在Agentic AI浪潮中分到一杯羹。
3. 长期:异构计算是终局
英伟达自己也在布局GPU/ASIC/CPU/CXL/低时延推理芯片的协同体系。未来的数据中心不会是单一架构打天下,而是各种专用芯片各司其职。这对国内芯片公司来说,意味着不必在通用GPU上与英伟达正面硬刚,可以在某个细分领域做深做透。
4. 国产替代的节奏不会因H200解禁而逆转
阿里、腾讯一边采购H200,一边也在加码国产芯片。腾讯高管明确表示“下半年将有更多国产芯片陆续投入使用”。短期用H200填缺口,长期用国产芯片替代——这个双轨策略不会改变。
五、风险提示(报告原文)
技术落地缓慢:Cerebras等新型架构从实验室到大规模商用,仍面临良率、成本、散热等工程挑战
中美贸易摩擦:出口管制政策随时可能调整,Groq方案是否能真正对华出口仍存在不确定性
芯片需求不及预期:如果AI应用商业化慢于预期,算力投资可能降温
写在最后
英伟达依然是这个时代的算力之王。但王座的周围,已经出现了新的挑战者——不是在通用GPU上正面硬刚,而是在低时延推理、晶圆级计算等新维度上另辟蹊径。
H200解禁、Groq蓄势、Cerebras上市——这三件事放在一周内发生,绝不是巧合。它标志着AI算力正在从“训练优先”转向“推理优先”,从“通用为王”转向“异构共存”。
对于投资者来说,与其纠结“英伟达还能不能涨”,不如多想想:下一个算力架构的颠覆性创新,会来自哪里?
责声明:本文基于华泰证券《英伟达(NVDA):关注Groq芯片对华出口与Cerebras晶圆级芯片趋势》研究报告整理,内容仅为客观转述,不构成任何投资建议。市场有风险,投资需谨慎。
602