过去两年,大家的目光都盯着GPU、HBM、光模块。但最近,另一颗“不起眼”的芯片开始悄悄走俏——PCIe Switch(高速交换芯片)
据东方证券最新报告,单颗高端PCIe Switch芯片单价已经达到上千美元(如博通PEX89000系列),而且货期长达50周,处于受限供货状态。
为什么会这样?因为AI服务器里,CPU的PCIe通道数量有限(一颗CPU通常只有几十个通道),而一台8卡GPU服务器需要同时连接GPU、网卡、SSD、加速卡……通道根本不够用。PCIe Switch的作用,就是把PCIe通道“一扩多”,让所有设备都能高速互通。
更重要的是,进入Agent推理时代后,PCIe Switch的应用场景从单纯的服务器内部互联(Scale In),扩展到了GPU Scale Up组网和CXL内存扩展——三轮驱动,需求正在爆发。
今天我们用这篇报告,把PCIe Switch讲透:它是什么?为什么突然重要?国产厂商有哪些机会?
一、PCIe Switch是什么?数据中心里的“交通枢纽”
先科普一下。
PCIe(Peripheral Component Interconnect Express)是第三代I/O总线标准,2003年诞生,现在已经成为服务器、PC、数据中心里连接CPU和各种外设(GPU、网卡、SSD等)的“主干道”。其带宽大约每三年翻一番:PCIe 5.0到6.0再到7.0,7.0的x16链路带宽已达512GB/s。
但问题是:一颗CPU的PCIe通道数量是有限的。比如一颗主流服务器CPU可能提供80-128个PCIe通道。一台8卡GPU服务器,每颗GPU要占16个通道,光GPU就吃掉128个通道,网卡、SSD、加速卡全没地方接。
这时候就需要PCIe Switch。它就像一个“交通枢纽”,一端连接CPU,另一端分出几十上百个端口,连接GPU、网卡、存储等设备。数据通过Switch进行路由和分发,从而大幅扩展系统的连接能力。
报告里有一个很直观的例子:阿里磐久超节点服务器,单个Compute tray内就配备了2颗PCIe Switch。
二、Agent推理时代,PCIe Switch的“三轮驱动”
报告提出:PCIe Switch的需求增长,由三大场景共同驱动。
驱动1:Scale In——AI服务器内部互联(基本盘)
这是最传统的应用。一台8卡AI服务器,至少需要2-4颗PCIe Switch(每颗CPU配1-2颗)。GPU数量越多,Switch用量越大。随着国产AI服务器出货量持续攀升,这部分需求稳中有升。
驱动2:Scale Up——GPU超节点互联(新增量)
大模型训练需要GPU之间极低延迟、超高带宽的互联。虽然英伟达用NVLink,国产GPU厂商(如壁仞、沐曦)也在研发自己的高速互联协议(Blink、MetaXLink),但这些协议目前大多基于PCIe物理层。在标准成熟前,PCIe Switch仍然是GPU Scale Up组网的基础方案。
报告特别提到:盛科通信等国内交换芯片厂商,已参与中国移动发起的OISA 2.0协议,将超节点互联高带宽域扩展到1024卡。盛科的12.8Tbps及25.6Tbps高端旗舰芯片已进入市场推广和逐步应用阶段。翻译:以前GPU之间“打电话”要走PCIe Switch,现在虽然有了专线,但PCIe依然是基础设施,用量反而更大。
驱动3:存储扩展——CXL内存池化(未来增量)
进入Agent推理阶段,CPU承担大量的数据前处理和KV Cache存储任务——就是大模型推理时,把历史对话的关键信息存起来,避免重复计算。KV Cache非常消耗内存容量,传统DRAM又贵又不够用。
解决方案是CXL(Compute Express Link)。通过支持CXL协议的PCIe Switch,可以把多个服务器内存池化,让CPU直接访问远端内存,延迟低至百纳秒级,带宽百GB级,容量可达10TB级。
阿里磐久CXL超节点服务器就是典型案例。这种架构下,PCIe Switch不再是“通道扩展器”,而是内存互联的核心枢纽。
报告总结:Scale In + Scale Up + 存储,三轮驱动PCIe Switch需求加速增长。
三、格局:海外巨头垄断,国产替代空间巨大
目前高端PCIe交换芯片市场,基本被美国博通(Broadcom)垄断。博通的PEX89000系列,单颗售价上千美元,货期50周左右,而且经常处于“受限供货”状态——不是你想买就能买。
这意味着两件事:
国内AI服务器厂商在关键元器件上,仍面临供应链安全风险
国产替代空间巨大——只要能做出同等性能、稳定供货的芯片,客户会抢着要
报告点名了国内两家主要玩家:
1. 数渡科技(万通发展旗下子公司)
已推出PCIe 5.0交换芯片,具有48 lane、104 lane、144 lane三种规格,支持灵活Fabric组网、国密算法等。产品矩阵基本对标博通的主流型号。
信息泛滥,优质难寻。芯链团星球,只筛选高价值行业报告。近期精选:
《中芯 26Q2 指引超预期,阿里&腾讯助力国产芯片放量》
《Agent推理时代,交换芯片持续膨胀》
《AMD 将 Agentic AI 定义为下一阶段 AI 需求的关键变化》
2. 澜起科技(688008,买入评级)
在PCIe/CXL互连领域,已量产PCIe Retimer和CXL MXC两款产品,并持续推进PCIe Switch芯片的研发,进一步完善产品矩阵。
此外,盛科通信虽然主营以太网交换芯片,但其高端产品也在积极参与OISA等Scale Up协议,与PCIe Switch形成协同。
报告指出:随着国产芯片陆续商用落地,有望逐步打破海外厂商垄断格局。相关标的包括万通发展(600246,未评级)、盛科通信-U(688702,未评级)、澜起科技(688008,买入)、裕太微-U(688515,未评级)。
四、为什么现在值得关注PCIe Switch?
三个原因:
第一,AI推理需求正在爆发。
Agent推理需要大量的CPU预处理和KV Cache存储,直接拉动了PCIe Switch和CXL Switch的需求。这不是“远期故事”,而是正在发生的产业趋势。
第二,国产供应链正在加速。
从数渡科技的量产产品,到澜起科技的研发推进,再到盛科通信的生态参与,国产PCIe/CXL交换芯片已经具备了从“可用”到“好用”的基础。只要产能跟得上,替代博通只是时间问题。
第三,单颗价值量高,国产替代弹性大。
一颗高端PCIe Switch上千美元,一台AI服务器用2-4颗,一个万卡集群用几百上千颗。哪怕只替代一部分,对应的市场空间也相当可观。
风险提示
AI发展不及预期:如果大模型应用放缓,云厂商缩减资本开支,Switch需求也会下降
行业竞争加剧:PCIe Switch门槛虽高,但一旦国产突破,可能会陷入价格战
写在最后
过去两年,半导体投资的主线是“算力”——GPU、HBM、光模块。但算力再强,数据搬不动、通道不够宽,也是白搭。
PCIe Switch就是那个容易被忽略,但绝对绕不开的“隐形冠军”。
进入Agent推理时代,它不仅承担着服务器内部的“交通调度”,还在Scale Up组网和CXL内存池化中扮演关键角色。三股力量叠加,需求确定性极强。
而国产厂商,正在从“零”到“一”打破博通的垄断。这不仅是供应链安全的胜利,更是国产半导体在“小赛道”里做出“大文章”的又一个例证。
免责声明:本文基于东方证券《Agent推理时代,交换芯片持续通胀》研究报告整理,内容仅为客观转述,不构成任何投资建议。市场有风险,投资需谨慎。
941