搞AI的人都知道,算力集群就像一座超大型工厂:
GPU是“工人”,HBM是“原材料仓库”
那交换芯片就是工厂里的“高速公路”和“交通指挥中心”。
没有它,一万个GPU之间就是“鸡同鸭讲”,数据传不过去,算力再强也白搭。
过去两年,大家的目光全盯着GPU、HBM、光模块。但最近,华泰证券一份深度报告指出:交换芯片,正在被AI超节点“带飞”,开启二次成长。
2028年国产交换芯片市场规模有望达到242亿元,年复合增速超过96%。而国内厂商目前市占率只有1.6%。这中间的差距,就是机会。
今天我们就来拆解这份报告,讲透交换芯片为什么突然变得这么重要,以及国产玩家到底能不能“弯道超车”。
一、交换芯片是什么?为什么AI集群离不开它?
交换芯片是交换机的“大脑”,占交换机成本30%以上。它的任务就是:把数据包从A端口精准、快速地转发到B端口。
一台AI服务器里有8颗GPU,它们之间要频繁交换数据(梯度同步、参数传递)。单机8卡还好,但当集群规模扩大到千卡、万卡,GPU之间的“跨服务器”通信就必须靠交换机和交换芯片来调度。
如果交换芯片性能不行,就会出现“GPU等数据”的现象——算力再高,也只能干瞪眼。
两个关键概念:
Scale-out(横向扩展):不同服务器之间的互联,就像城市之间的高速公路。带宽要大,但时延可以稍高(微秒级)。
Scale-up(纵向扩展):同一机柜内GPU之间的互联,就像工厂车间里的传送带。要求极低时延(纳秒级)、超高带宽。
过去Scale-out是主流。但AI大模型训练和推理对“内存语义”访问的需求激增,Scale-up的地位被急剧拉升——这就是“超节点”架构的核心。
英伟达的GB200 NVL72机柜,用18颗NVSwitch把72颗GPU“焊”在一起,内部总带宽高达129.6TB/s,是Scale-out带宽的9倍。这就是超节点的威力。
二、超节点时代,交换芯片用量大幅提升
报告里有一个非常直观的对比:
英伟达H100 4SU集群(1024卡),用48台交换机,交换芯片与GPU配比约5%。
华为CM384超节点(384卡),用了56台交换机,等效交换芯片与GPU配比约22%。
为什么国产超节点用更多交换机?
因为单卡算力有差距,要靠网络来补。
昇腾910C单卡算力大约是英伟达B200的三分之一,但华为通过CM384超节点(384卡 vs 英伟达NVL72的72卡),用5.3倍的卡数实现了1.7倍的算力——这里的关键就是Scale-up网络堆得更密。
报告测算:2028年国内Scale-up交换芯片市场规模将达到172亿元,年复合增速231%,远超Scale-out的34%增速。翻译:以前大家只关心“路够不够宽”(Scale-out),现在更关心“路口红绿灯够不够快、车道够不够多”(Scale-up)。交换芯片的用量和价值都在飙升。
三、国产替代:从1.6%到65%,还有多大空间?
先看现状:
全球交换芯片市场,博通一家独大,市占率54.6%;加上Marvell、思科,CR3达到77%。
在中国商用交换芯片市场,博通、Marvell、瑞昱合计占97.8%,国产厂商盛科通信仅占1.6%。
差距非常大。但报告给出了乐观的国产化路径预测:
| 年份 | Scale-out国产化率 | Scale-up国产化率 |
|---|---|---|
| 2026E | 40% | 50% |
| 2027E | 50% | 65% |
| 2028E | 65% | 75% |
对应的国产市场规模:2028年Scale-out达113亿元,Scale-up达129亿元,合计242亿元。
为什么国产化能提速?三个原因:
政策与供应链安全:美国出口管制不断加码,交换芯片作为算力网络的“心脏”,必须自主可控。
超节点开辟新赛道:Scale-up领域尚无统一标准,英伟达用私有NVLink,国内正在推开放协议(UALink、OISA、ALS等)。国产交换芯片厂商与国内GPU厂商可以深度适配,海外巨头反而没那么灵活。
国内厂商技术追赶:盛科通信的Arctic系列已做到25.6T交换容量、800G端口速率,进入市场推广阶段;中兴微电子的“凌云”交换芯片支持超节点组网;华为的UB-Switch已在CM384中规模商用。
四、国内外厂商“兵器谱”:谁在领跑,谁在追赶?
海外阵营:
博通:Tomahawk 6,102.4T交换容量,支持1.6T端口,3nm制程,全球标杆。
英伟达:Spectrum-6(以太网)和Quantum-X800(InfiniBand),绑定自家GPU生态。
思科:Silicon One G300,同样102.4T,主打运营商和企业网。
国产阵营:
| 公司 | 最高端产品 | 交换容量 | 亮点 |
|---|---|---|---|
| 盛科通信 | Arctic系列 | 25.6T | 国内商用龙头,已导入客户 |
| 中兴微电子 | 凌云 | 未公开 | 支撑Nebula星云超节点,国内首个112G SerDes |
| 华为 | UB-Switch | 19.2T | CM384超节点自用,已验证大规模组网 |
| 楠菲微电子 | ES8000 + UALink芯片 | 8T / 28.8T | UALink交换芯片可与GPU联测 |
| 云合智网 | Clounix CLX850128 | 12.8T | 已用于菲菱科思数据中心交换机 |
| 众星微 | 32T类IB芯片 | 32T | 布局PCle Switch和UALink |
从技术代际看,国产最高25.6T,海外已到102.4T,差距仍在。但在国内超节点场景,25.6T~51.2T够用,而且国产厂商的响应速度、适配意愿、供应链安全是加分项。
五、空间测算:242亿市场怎么来的?
报告给出了详细的测算逻辑:
Scale-out市场:参考IDC数据中心交换机市场数据,假设交换芯片占交换机价值25%,2028年国内数据中心交换机市场规模约100亿美元,对应交换芯片市场174亿元。国产化率65% → 国产113亿元。
Scale-up市场:假设2028年国产AI芯片出货520万颗,其中45%用于超节点,超节点内交换芯片与GPU配比30%,单价3500美元 → 总市场172亿元。国产化率75% → 国产129亿元。
两者合计242亿元,2026-2028年CAGR高达96%。注意:这是“国产交换芯片”的可触达市场,不是整个交换芯片市场。博通、Marvell在中国仍会保留一定份额,但国产厂商的蛋糕正在快速变大。
六、风险与挑战:别只看到星辰大海
报告也坦诚列出了几个现实困难:
供应链认证周期长:交换机关乎整个数据中心的稳定性,客户不敢轻易换芯片,导入周期1-2年。
SerDes IP自主化:112G SerDes国内刚突破,下一代224G难度巨大,若依赖海外IP授权,仍有被卡风险。
Scale-up协议不统一:UALink、OISA、ALS、UB……各家标准不同,交换芯片厂商需要适配多个生态,研发成本高。
但长期看,这些困难都是国产化过程中的“必经之坎”,并非不可逾越。
写在最后
交换芯片这个赛道,过去太“隐形”了——大家只看GPU,谁关心交换机里的那颗小芯片?但AI集群规模突破万卡、十万卡后,网络瓶颈会越来越突出。
超节点架构的本质,就是用“运力”来弥补“算力”的差距。
国产GPU单卡性能短时间追不上英伟达,但我们可以通过更密集、更高效的Scale-up网络,让集群整体性能逼近甚至局部超越。而这,需要国产交换芯片厂商和GPU厂商深度协同。
盛科通信、中兴微、华为、楠菲微……这些名字,可能很快就会从“幕后”走到“台前”。
免责声明:本文基于华泰证券《交换芯片:AI超节点驱动二次成长》研究报告整理,内容仅为客观转述,不构成任何投资建议。市场有风险,投资需谨慎。
368