最近,随着摩尔线程、沐曦股份在科创板的先后上市,壁仞科技和燧原科技也紧随其后进入上市进程的事情,掀起了一股国产GPU的热潮。
市场普遍沉浸在“国产替代”、“万亿赛道”、“IPO热潮”的乐观情绪中。然而,三大潜在灰犀牛风险正悄然逼近:
1. Scaling Laws(规模定律)可能正在失效或边际效益锐减;
2. 前两年算力基建的过度扩张导致的“烂尾”的风险正在上升;
3. 全球头部云服务商(CSP)加速自研芯片,挤压第三方GPU厂商生存空间。
这三者叠加,或将对国产GPU企业构成系统性挑战。
先来说一下Scaling Laws,这个定律是指模型性能随数据量、参数量和算力投入呈幂律增长。过去几年,大模型竞赛都是基于堆参数、堆卡、堆电费这个逻辑。
但现在,现实的拐点已经出现了。
从最新的模型Gemini 3、GPT-5 来看,单纯扩大规模带来的性能提升已经显著放缓。
同时,能效比也在成为瓶颈:每增加1倍算力,能耗可能翻倍,而性能仅提升10%到20%。
国产的GPU,目前还普遍处于追赶阶段,如果继续沿用“堆卡”的逻辑,就可能会陷入“高投入、低回报”的陷阱。
摩尔线程、沐曦都主打“对标H100”,如果无法在能效、软件栈、稀疏计算等新维度实现突破的话,它们的硬件将面临“性能过剩但无用武之地”的尴尬。
并且,从投资者的预期看,也可能从“规模驱动”转向“效率驱动”,从而倒逼国产GPU从“跑分竞争”转向“场景适配”。
这样看来,如果Scaling Laws失效成为共识,将直接削弱国产GPU“以量补质”的战略逻辑,迫使行业进入“精耕细作”的时代。
再来看看算力基建烂尾的风险。
这不是一个新话题。过去两年,各地政府争相建设智算中心、超算集群,动辄宣称“万P级”、“百亿亿次”。
而国产GPU,像燧原、壁仞都成为地方政府采购的主力,订单激增,沐曦2025年在手的订单达到14.3亿元。
但这里存在一定的隐患。一个是需求虚高:大量智算中心缺乏真实AI负载,更像是一个“展示工程”。
一个是运维成本失控:GPU集群的功耗巨大,电费+冷却的成本远超预期,部分项目已出现“建得起、用不起”的现象。
再一个是技术迭代周期非常快:今天刚部署好A100/H100级替代品,两年后可能已被淘汰,造成资产闲置。
这对国产GPU肯定会造成冲击。短期利好订单,但长期依赖政府/国企采购不可持续。
如果2026到2027年出现大规模基建收缩或财政紧缩,国产GPU企业有很大可能会面临“订单断崖”的情况。
尤其对聚焦数据中心、缺乏消费端回旋余地的企业,风险更高。
更进一步说,如果算力基建从“投资拉动”转向“效益考核”,将会暴露大量低效的项目,这肯定会连带拖累GPU供应商。
最后,再来看看云厂CSP们自研芯片的“降维打击”。
全球CSP加速垂直整合的趋势已经摆上台面:
亚马逊的Trainium芯片已经覆盖80%的推理负载;
微软已经和AMD合作定制MI300X,并投资CoreWeave构建替代生态;
阿里也自研了AI推理芯片含光800和通义千问专用的NPU;
百度的昆仑芯已迭代至第三代;
腾讯不仅是燧原股东,也自研AI推理芯片紫霄。
CSP们为什么要花巨资自研芯片?至少是因为三个核心优势:
一是软硬件更协同。自研的芯片专为自家的模型优化,能效比远超通用GPU;
二是成本更可控。无需支付英伟达高溢价,长期的TCO,也就是总拥有成本更低;
三是供应链更安全。可以规避出口管制的风险,尤其对中国的CSP而言。
这样看来,原本是国产GPU的重要客户的CSP,现在却纷纷“自立门户”。CSP自研芯片已经不是“可选项”,而是“必选项”。国产GPU如果不能打入非CSP生态(如中小企业、科研机构、制造业),可能就会被困在一个愈发狭窄的市场。
三大灰犀牛在逼近,国产GPU的应对之道在哪里?
我觉得,面对Scaling Laws 失效,要聚焦能效比、稀疏训练、混合精度、编译器优化;从“通用算力”转向“场景专用”。
面对算力基建烂尾的风险,要拓展非政府客户,例如汽车、医疗、工业仿真等;同时发展租赁、算力即服务(CaaS)的商业模式。
面对CSP自研芯片带来的挤压,要构建开放的生态,例如兼容CUDA,降低迁移的成本;联合独立软件销售商来打造垂直解决方案。
此外,今年工信部牵头组建的“国产GPU适配联盟”正在制定适配标准,如果这个标准能够真正落地,也有可能形成生态护城河,可以缓解CSP封闭体系带来的挤压。
国产GPU的崛起是国家战略所需,也是技术自主的必然路径。但热潮之下,必须警惕“灰犀牛”,当规模红利消退、基建泡沫破裂、CSP筑起高墙,唯有真正具备技术纵深、商业闭环和生态韧性的企业,才能穿越周期,成为真正的赢家。否则,这场IPO盛宴带来的热潮,可能只是一场昂贵的集体幻觉。
1591