• 正文
  • 相关推荐
申请入驻 产业图谱

AI算力“高速公路”大升级:交换芯片,下一个被国产替代盯上的黄金赛道

19小时前
368
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

搞AI的人都知道,算力集群就像一座超大型工厂:

GPU是“工人”,HBM是“原材料仓库”

那交换芯片就是工厂里的“高速公路”和“交通指挥中心”。

没有它,一万个GPU之间就是“鸡同鸭讲”,数据传不过去,算力再强也白搭。

过去两年,大家的目光全盯着GPU、HBM、光模块。但最近,华泰证券一份深度报告指出:交换芯片,正在被AI超节点“带飞”,开启二次成长。

2028年国产交换芯片市场规模有望达到242亿元,年复合增速超过96%。而国内厂商目前市占率只有1.6%。这中间的差距,就是机会。

今天我们就来拆解这份报告,讲透交换芯片为什么突然变得这么重要,以及国产玩家到底能不能“弯道超车”。

一、交换芯片是什么?为什么AI集群离不开它?

交换芯片是交换机的“大脑”,占交换机成本30%以上。它的任务就是:把数据包从A端口精准、快速地转发到B端口

一台AI服务器里有8颗GPU,它们之间要频繁交换数据(梯度同步、参数传递)。单机8卡还好,但当集群规模扩大到千卡、万卡,GPU之间的“跨服务器”通信就必须靠交换机和交换芯片来调度。

如果交换芯片性能不行,就会出现“GPU等数据”的现象——算力再高,也只能干瞪眼。

两个关键概念:

Scale-out(横向扩展):不同服务器之间的互联,就像城市之间的高速公路。带宽要大,但时延可以稍高(微秒级)。

Scale-up(纵向扩展):同一机柜内GPU之间的互联,就像工厂车间里的传送带。要求极低时延(纳秒级)、超高带宽。

过去Scale-out是主流。但AI大模型训练和推理对“内存语义”访问的需求激增,Scale-up的地位被急剧拉升——这就是“超节点”架构的核心。

英伟达的GB200 NVL72机柜,用18颗NVSwitch把72颗GPU“焊”在一起,内部总带宽高达129.6TB/s,是Scale-out带宽的9倍。这就是超节点的威力。

二、超节点时代,交换芯片用量大幅提升

报告里有一个非常直观的对比:

英伟达H100 4SU集群(1024卡),用48台交换机,交换芯片与GPU配比约5%

华为CM384超节点(384卡),用了56台交换机,等效交换芯片与GPU配比约22%

为什么国产超节点用更多交换机?

因为单卡算力有差距,要靠网络来补。

昇腾910C单卡算力大约是英伟达B200的三分之一,但华为通过CM384超节点(384卡 vs 英伟达NVL72的72卡),用5.3倍的卡数实现了1.7倍的算力——这里的关键就是Scale-up网络堆得更密。

报告测算:2028年国内Scale-up交换芯片市场规模将达到172亿元,年复合增速231%,远超Scale-out的34%增速。翻译:以前大家只关心“路够不够宽”(Scale-out),现在更关心“路口红绿灯够不够快、车道够不够多”(Scale-up)。交换芯片的用量和价值都在飙升。

三、国产替代:从1.6%到65%,还有多大空间?

先看现状:

全球交换芯片市场,博通一家独大,市占率54.6%;加上Marvell、思科,CR3达到77%。

在中国商用交换芯片市场,博通、Marvell、瑞昱合计占97.8%,国产厂商盛科通信仅占1.6%

差距非常大。但报告给出了乐观的国产化路径预测:

年份 Scale-out国产化率 Scale-up国产化率
2026E 40% 50%
2027E 50% 65%
2028E 65% 75%

对应的国产市场规模:2028年Scale-out达113亿元,Scale-up达129亿元,合计242亿元

为什么国产化能提速?三个原因:

政策与供应链安全:美国出口管制不断加码,交换芯片作为算力网络的“心脏”,必须自主可控。

超节点开辟新赛道:Scale-up领域尚无统一标准,英伟达用私有NVLink,国内正在推开放协议(UALink、OISA、ALS等)。国产交换芯片厂商与国内GPU厂商可以深度适配,海外巨头反而没那么灵活。

国内厂商技术追赶:盛科通信的Arctic系列已做到25.6T交换容量、800G端口速率,进入市场推广阶段;中兴微电子的“凌云”交换芯片支持超节点组网;华为的UB-Switch已在CM384中规模商用。

四、国内外厂商“兵器谱”:谁在领跑,谁在追赶?

海外阵营:

博通:Tomahawk 6,102.4T交换容量,支持1.6T端口,3nm制程,全球标杆。

英伟达:Spectrum-6(以太网)和Quantum-X800(InfiniBand),绑定自家GPU生态。

思科:Silicon One G300,同样102.4T,主打运营商和企业网。

国产阵营:

公司 最高端产品 交换容量 亮点
盛科通信 Arctic系列 25.6T 国内商用龙头,已导入客户
中兴微电子 凌云 未公开 支撑Nebula星云超节点,国内首个112G SerDes
华为 UB-Switch 19.2T CM384超节点自用,已验证大规模组网
楠菲微电子 ES8000 + UALink芯片 8T / 28.8T UALink交换芯片可与GPU联测
云合智网 Clounix CLX850128 12.8T 已用于菲菱科思数据中心交换机
众星微 32T类IB芯片 32T 布局PCle Switch和UALink

从技术代际看,国产最高25.6T,海外已到102.4T,差距仍在。但在国内超节点场景,25.6T~51.2T够用,而且国产厂商的响应速度、适配意愿、供应链安全是加分项。

五、空间测算:242亿市场怎么来的?

报告给出了详细的测算逻辑:

Scale-out市场:参考IDC数据中心交换机市场数据,假设交换芯片占交换机价值25%,2028年国内数据中心交换机市场规模约100亿美元,对应交换芯片市场174亿元。国产化率65% → 国产113亿元。

Scale-up市场:假设2028年国产AI芯片出货520万颗,其中45%用于超节点,超节点内交换芯片与GPU配比30%,单价3500美元 → 总市场172亿元。国产化率75% → 国产129亿元。

两者合计242亿元,2026-2028年CAGR高达96%。注意:这是“国产交换芯片”的可触达市场,不是整个交换芯片市场。博通、Marvell在中国仍会保留一定份额,但国产厂商的蛋糕正在快速变大。

六、风险与挑战:别只看到星辰大海

报告也坦诚列出了几个现实困难:

供应链认证周期长:交换机关乎整个数据中心的稳定性,客户不敢轻易换芯片,导入周期1-2年。

SerDes IP自主化:112G SerDes国内刚突破,下一代224G难度巨大,若依赖海外IP授权,仍有被卡风险。

Scale-up协议不统一:UALink、OISA、ALS、UB……各家标准不同,交换芯片厂商需要适配多个生态,研发成本高。

但长期看,这些困难都是国产化过程中的“必经之坎”,并非不可逾越。

写在最后

交换芯片这个赛道,过去太“隐形”了——大家只看GPU,谁关心交换机里的那颗小芯片?但AI集群规模突破万卡、十万卡后,网络瓶颈会越来越突出。

超节点架构的本质,就是用“运力”来弥补“算力”的差距。

国产GPU单卡性能短时间追不上英伟达,但我们可以通过更密集、更高效的Scale-up网络,让集群整体性能逼近甚至局部超越。而这,需要国产交换芯片厂商和GPU厂商深度协同。

盛科通信、中兴微、华为、楠菲微……这些名字,可能很快就会从“幕后”走到“台前”。

免责声明:本文基于华泰证券《交换芯片:AI超节点驱动二次成长》研究报告整理,内容仅为客观转述,不构成任何投资建议。市场有风险,投资需谨慎。

相关推荐