AI算力“高速公路”大升级：交换芯片，下一个被国产替代盯上的黄金赛道

搞AI的人都知道，算力集群就像一座超大型工厂：

GPU是“工人”，HBM是“原材料仓库”

那交换芯片就是工厂里的“高速公路”和“交通指挥中心”。

没有它，一万个GPU之间就是“鸡同鸭讲”，数据传不过去，算力再强也白搭。

过去两年，大家的目光全盯着GPU、HBM、光模块。但最近，华泰证券一份深度报告指出：交换芯片，正在被AI超节点“带飞”，开启二次成长。

2028年国产交换芯片市场规模有望达到242亿元，年复合增速超过96%。而国内厂商目前市占率只有1.6%。这中间的差距，就是机会。

今天我们就来拆解这份报告，讲透交换芯片为什么突然变得这么重要，以及国产玩家到底能不能“弯道超车”。

一、交换芯片是什么？为什么AI集群离不开它？

交换芯片是交换机的“大脑”，占交换机成本30%以上。它的任务就是：把数据包从A端口精准、快速地转发到B端口。

一台AI服务器里有8颗GPU，它们之间要频繁交换数据（梯度同步、参数传递）。单机8卡还好，但当集群规模扩大到千卡、万卡，GPU之间的“跨服务器”通信就必须靠交换机和交换芯片来调度。

如果交换芯片性能不行，就会出现“GPU等数据”的现象——算力再高，也只能干瞪眼。

两个关键概念：

Scale-out（横向扩展）：不同服务器之间的互联，就像城市之间的高速公路。带宽要大，但时延可以稍高（微秒级）。

Scale-up（纵向扩展）：同一机柜内GPU之间的互联，就像工厂车间里的传送带。要求极低时延（纳秒级）、超高带宽。

过去Scale-out是主流。但AI大模型训练和推理对“内存语义”访问的需求激增，Scale-up的地位被急剧拉升——这就是“超节点”架构的核心。

英伟达的GB200 NVL72机柜，用18颗NVSwitch把72颗GPU“焊”在一起，内部总带宽高达129.6TB/s，是Scale-out带宽的9倍。这就是超节点的威力。

二、超节点时代，交换芯片用量大幅提升

报告里有一个非常直观的对比：

英伟达H100 4SU集群（1024卡），用48台交换机，交换芯片与GPU配比约5%。

华为CM384超节点（384卡），用了56台交换机，等效交换芯片与GPU配比约22%。

为什么国产超节点用更多交换机？

因为单卡算力有差距，要靠网络来补。

昇腾910C单卡算力大约是英伟达B200的三分之一，但华为通过CM384超节点（384卡 vs 英伟达NVL72的72卡），用5.3倍的卡数实现了1.7倍的算力——这里的关键就是Scale-up网络堆得更密。

报告测算：2028年国内Scale-up交换芯片市场规模将达到172亿元，年复合增速231%，远超Scale-out的34%增速。翻译：以前大家只关心“路够不够宽”（Scale-out），现在更关心“路口红绿灯够不够快、车道够不够多”（Scale-up）。交换芯片的用量和价值都在飙升。

三、国产替代：从1.6%到65%，还有多大空间？

先看现状：

全球交换芯片市场，博通一家独大，市占率54.6%；加上Marvell、思科，CR3达到77%。

在中国商用交换芯片市场，博通、Marvell、瑞昱合计占97.8%，国产厂商盛科通信仅占1.6%。

差距非常大。但报告给出了乐观的国产化路径预测：

年份	Scale-out国产化率	Scale-up国产化率
2026E	40%	50%
2027E	50%	65%
2028E	65%	75%

对应的国产市场规模：2028年Scale-out达113亿元，Scale-up达129亿元，合计242亿元。

为什么国产化能提速？三个原因：

政策与供应链安全：美国出口管制不断加码，交换芯片作为算力网络的“心脏”，必须自主可控。

超节点开辟新赛道：Scale-up领域尚无统一标准，英伟达用私有NVLink，国内正在推开放协议（UALink、OISA、ALS等）。国产交换芯片厂商与国内GPU厂商可以深度适配，海外巨头反而没那么灵活。

国内厂商技术追赶：盛科通信的Arctic系列已做到25.6T交换容量、800G端口速率，进入市场推广阶段；中兴微电子的“凌云”交换芯片支持超节点组网；华为的UB-Switch已在CM384中规模商用。

四、国内外厂商“兵器谱”：谁在领跑，谁在追赶？

海外阵营：

博通：Tomahawk 6，102.4T交换容量，支持1.6T端口，3nm制程，全球标杆。

英伟达：Spectrum-6（以太网）和Quantum-X800（InfiniBand），绑定自家GPU生态。

思科：Silicon One G300，同样102.4T，主打运营商和企业网。

国产阵营：

公司	最高端产品	交换容量	亮点
盛科通信	Arctic系列	25.6T	国内商用龙头，已导入客户
中兴微电子	凌云	未公开	支撑Nebula星云超节点，国内首个112G SerDes
华为	UB-Switch	19.2T	CM384超节点自用，已验证大规模组网
楠菲微电子	ES8000 + UALink芯片	8T / 28.8T	UALink交换芯片可与GPU联测
云合智网	Clounix CLX850128	12.8T	已用于菲菱科思数据中心交换机
众星微	32T类IB芯片	32T	布局PCle Switch和UALink

从技术代际看，国产最高25.6T，海外已到102.4T，差距仍在。但在国内超节点场景，25.6T~51.2T够用，而且国产厂商的响应速度、适配意愿、供应链安全是加分项。

五、空间测算：242亿市场怎么来的？

报告给出了详细的测算逻辑：

Scale-out市场：参考IDC数据中心交换机市场数据，假设交换芯片占交换机价值25%，2028年国内数据中心交换机市场规模约100亿美元，对应交换芯片市场174亿元。国产化率65% → 国产113亿元。

Scale-up市场：假设2028年国产AI芯片出货520万颗，其中45%用于超节点，超节点内交换芯片与GPU配比30%，单价3500美元 → 总市场172亿元。国产化率75% → 国产129亿元。

两者合计242亿元，2026-2028年CAGR高达96%。注意：这是“国产交换芯片”的可触达市场，不是整个交换芯片市场。博通、Marvell在中国仍会保留一定份额，但国产厂商的蛋糕正在快速变大。

六、风险与挑战：别只看到星辰大海

报告也坦诚列出了几个现实困难：

供应链认证周期长：交换机关乎整个数据中心的稳定性，客户不敢轻易换芯片，导入周期1-2年。

SerDes IP自主化：112G SerDes国内刚突破，下一代224G难度巨大，若依赖海外IP授权，仍有被卡风险。

Scale-up协议不统一：UALink、OISA、ALS、UB……各家标准不同，交换芯片厂商需要适配多个生态，研发成本高。

但长期看，这些困难都是国产化过程中的“必经之坎”，并非不可逾越。

写在最后

交换芯片这个赛道，过去太“隐形”了——大家只看GPU，谁关心交换机里的那颗小芯片？但AI集群规模突破万卡、十万卡后，网络瓶颈会越来越突出。

超节点架构的本质，就是用“运力”来弥补“算力”的差距。

国产GPU单卡性能短时间追不上英伟达，但我们可以通过更密集、更高效的Scale-up网络，让集群整体性能逼近甚至局部超越。而这，需要国产交换芯片厂商和GPU厂商深度协同。

盛科通信、中兴微、华为、楠菲微……这些名字，可能很快就会从“幕后”走到“台前”。

免责声明：本文基于华泰证券《交换芯片：AI超节点驱动二次成长》研究报告整理，内容仅为客观转述，不构成任何投资建议。市场有风险，投资需谨慎。