在 AI 算力基础设施的讨论中,「交换芯片」是一个高频词。但如果你仔细听,会发现它其实指代两种完全不同的芯片——有人聊的是数据中心机架顶端的以太网交换芯片,有人聊的是服务器内部 GPU 互联的PCIe 交换芯片。
它们都叫 Switch,都有「交换」二字,但一个工作在 OSI 网络模型,一个工作在板级总线拓扑;一个解决跨机柜的 Scale-Out 互联,一个解决机箱内的 Scale-Up 互联。
本文将从技术原理、架构差异、应用场景、市场格局和全量公司产品五个维度,为你彻底厘清这对「同名异构」的芯片品类。
一、一张图看懂核心差异
▎Scale-Out · 跨节点互联
以太网交换芯片
▎Scale-Up · 机箱内互联
PCIe 交换芯片
一句话总结:以太网交换芯片让不同服务器之间可以通信;PCIe 交换芯片让同一台服务器内部的 CPU、GPU、SSD 可以共享总线带宽。前者是「城市之间的高速公路网」,后者是「大楼内部的电梯井」。
二、技术架构深度对比
2.1 以太网交换芯片:OSI 网络模型的数据中枢
以太网交换芯片是交换机、路由器的核心 ASIC,负责接收、解析、查表、转发以太网数据帧。其内部采用高度流水线化的数据包处理架构:
Ingress Pipeline(入口流水线)——MAC 帧解析、VLAN 处理、L2/L3 查表、ACL 过滤
MMU / Buffer(存储管理单元)——数据包缓存、队列调度、拥塞控制(PFC / ECN)
Egress Pipeline(出口流水线)——报文编辑、VLAN 标签操作、QoS 调度
TCAM / SRAM 表项——高速硬件查找(MAC 表、路由表、ACL 表)
SerDes 接口——支持 10G / 25G / 50G / 100G / 400G / 800G 等端口速率
核心指标是交换容量(如 Tomahawk 5 的 51.2 Tbps)和端口速率(如 800G),高端芯片支持 RoCEv2 无损网络、PFC 优先级流控和 ECN 显式拥塞通知。
2.2 PCIe 交换芯片:总线拓扑的数据路由中枢
PCIe 交换芯片工作在 PCIe 事务层,负责在不同 PCIe 端点之间转发 TLP(Transaction Layer Packet)。其设计目标是低延迟——转发延迟通常在 100-150 ns 量级,比以太网交换芯片(数百 ns 到 μs 级)低一个数量级。
Upstream Port(上游端口)——连接 CPU / Root Complex
Downstream Ports(下游端口)——连接 GPU、NVMe SSD、网卡等端点
Switch Fabric(交换矩阵)——基于 BDF 地址的 TLP 路由、仲裁与转发
Buffer / Queue——端口拥塞时的数据包缓存
SR-IOV 引擎——硬件虚拟化,一个物理设备映射为多个虚拟功能(VF)
Multicast 引擎——GPU 集群 All-Reduce 通信中的多播复制
NTB(非透明桥)——多主机互联,允许两个独立 CPU 系统共享 PCIe 结构
核心指标是通道数(Lane Count)和 PCIe 代次。例如 Broadcom PEX89144 提供 144 条 PCIe 5.0 通道(32 GT/s),PEX90144 则为 144 条 PCIe 6.0 通道(64 GT/s)。
2.3 全方位技术参数对比
| 对比维度 | 以太网交换芯片 | PCIe 交换芯片 |
|---|---|---|
| 协议栈层级 | OSI L1-L3(PHY / MAC / IP) | PCIe 事务层 + 数据链路层 + 物理层 |
| 数据转发单元 | 以太网帧(64-9000+ 字节) | TLP 数据包(最大 4096 字节) |
| 寻址方式 | MAC 地址(L2)+ IP 地址(L3) | BDF 地址(Bus : Device : Function) |
| 转发延迟 | 数百 ns ~ 数 μs | ~100-150 ns |
| 最大带宽 | 单芯片 102.4 Tbps(Tomahawk 6) | 单芯片 144 通道 × 64 GT/s(Gen6) |
| 端口速率 | 1G / 10G / 25G / 100G / 200G / 400G / 800G | 以 Lane 为单位,x1 / x2 / x4 / x8 / x16 绑定 |
| 传输距离 | 铜缆 ~100m,光纤 ~10km+ | PCB 走线 ~数十厘米,Retimer 可扩展至 ~数米 |
| 拓扑结构 | Spine-Leaf / Mesh / Ring / Fat-Tree | 树状(Root Complex → Switch → Endpoint) |
| 流控机制 | PFC / ECN / 信用调度 | PCIe 信用流控(Credit-based) |
| 虚拟化支持 | VLAN / VXLAN / EVPN | SR-IOV / MR-IOV / NTB |
| 典型场景 | 数据中心网络、企业网、运营商承载网 | AI 服务器内部 GPU 互联、NVMe 存储阵列、多 CPU 互联 |
三、应用场景:Scale-Up 与 Scale-Out
理解两种交换芯片最直观的框架是 Scale-Up vs Scale-Out:
在单机柜或单服务器内部,通过 PCIe Switch 将多张 GPU、多块 NVMe SSD 连接到有限的 CPU 通道上。一台典型的 8 卡 H100 服务器内部需要 2-4 颗 PCIe Switch 来扩展 CPU 通道,让所有 GPU 都能以 x16 满速互联。
在数据中心跨机柜层面,通过以太网交换机(内置交换芯片)将数千甚至数万张 GPU 连接成集群。采用 Spine-Leaf 架构,Leaf 交换机负责接入机柜内服务器,Spine 交换机负责跨机柜高速转发。万卡级 GPU 集群需要数十到数百台以太网交换机。
在 AI 训练集群中,两种交换芯片并非竞争关系,而是互补协同:PCIe Switch 解决机箱内 GPU-to-GPU 直连,以太网 Switch 解决机柜间 All-Reduce 通信。两者共同构成了从芯片到集群的完整互联栈。
四、市场格局与规模
4.1 市场规模对比
| 细分市场 | 2024 年全球规模 | 2030-2032 年预测 | CAGR |
|---|---|---|---|
| 以太网交换芯片 | 约 65-70 亿美元 | 约 120-140 亿美元 | ~10-12% |
| PCIe 交换芯片 | 约 10.4-18.9 亿美元 | 约 48-58 亿美元 | ~15-20% |
以太网交换芯片市场体量更大、更成熟;但 PCIe 交换芯片增速更快,AI 服务器出货量激增是核心驱动力。
4.2 竞争格局:以太网交换芯片(商用市场)
| 厂商 | 中国商用份额 | 核心系列 | 定位 |
|---|---|---|---|
| Broadcom 博通 | ~61.7% | Tomahawk / Trident / Jericho | 绝对龙头,数据中心全场景覆盖 |
| Marvell 美满 | ~20.0% | Teralynx / Prestera | 第二,可编程 + 企业级双线 |
| Realtek 瑞昱 | ~16.1% | RTL 系列 | 中低端王者,消费级出货量全球第一 |
| 盛科通信 | ~1.6% | GoldenGate / TsingMa / Arctic | 国产唯一商用万兆+,份额快速攀升 |
4.3 竞争格局:PCIe 交换芯片
| 厂商 | 全球份额 | 最新代次 | 核心亮点 |
|---|---|---|---|
| Broadcom 博通 | ~70% | Gen5(Gen6 在研) | PEX89000 系列,路线图至 Gen8 |
| Microchip 微芯 | ~10-15% | Gen6(2025.10 首发) | 3nm 工艺,最高 160 通道 |
| Texas Instruments | ~5-8% | Gen2/3 | 低通道数 Packet Switch,前三大之一 |
| Diodes 达尔 | ~3-5% | Gen3/4 | 唯一车规级 PCIe Switch |
| ASMedia 祥硕 | ~2-3% | Gen3/4 | 消费级低通道数 Switch |
| NXP 恩智浦 | ~1-2% | Gen3/4 | PCIe Mux/PHY,嵌入式市场 |
* 份额为综合多方数据估算,前三大厂商(博通、微芯、TI)合计占全球约 84%
五、全量公司与产品盘点
▎以太网交换芯片 · 商用市场(外售芯片)
· Tomahawk 3(12.8T)→ Tomahawk 4(25.6T,7nm)→ Tomahawk 5(51.2T,5nm,800G)→ Tomahawk 6(102.4T,3nm,2025年发布,业界首款 CPO 版本 TH6-Davisson)
Trident 系列:中高端企业/云数据中心,高密度 100G/400G
Jericho 系列:运营商/广域网,Jericho4 支持设施间长距互联
Prestera 系列:传统强项,覆盖企业/运营商全系列交换机
整体落后博通约 1 年,可编程性为差异化优势
RTL9335 为最新高端型号,消费级交换机芯片出货量全球第一
覆盖 SOHO、SMB、企业接入层
TsingMa(CTC7132/CTC8180):440G-2.4Tbps,边缘计算/企业核心
Arctic 系列:12.8T/25.6Tbps,支持 800G 端口,2024 年发布,已进入新华三/锐捷网络供应链
国内唯一进入商用万兆+市场的企业
▎以太网交换芯片 · 自研阵营(自用为主 / 不对外销售)
搭载于 Cisco 8000 系列路由器与 Nexus 交换机,不对外销售
技术实力可比肩博通,但不对外商用。同时布局以太网 PHY 芯片
Spectrum-X 平台:Spectrum Switch + BlueField SuperNIC,以太网 AI 网络方案,直接对抗 InfiniBand 生态
收购 Mellanox 后整合而来
基于 P4 语言的可编程交换芯片(6.5-12.8 Tbps),支持完全自定义转发逻辑
面向需要灵活协议定制的高级用户
PCIe Switch 芯片:已量产,正推进 7nm/6nm 先进工艺
同时布局 PHY 芯片和智能网卡,年出货超 500 万颗,2026 年启动 IPO
▎以太网交换芯片 · 车载 / 工业 / 新兴
车载以太网 PHY 芯片累计出货超 1500 万颗,同时布局网卡芯片
集成自研 EtherNext 以太网 PHY,国内首家自主可控 PHY+Switch 集成芯片厂商
覆盖数通和车载两大市场
已研发出车载以太网 PHY 芯片和交换芯片,国内该领域自主研制第一梯队
拟 A 股 IPO
▎PCIe 交换芯片 · 全量厂商
PEX90144(Gen6,64 GT/s):5nm,144 通道,SC25 展出实物
路线图:2027 Gen7(91000 系列)→ 2029 Gen8(92000 系列)
Switchtec Gen6:2025 年 10 月全球首发 3nm PCIe 6.0 交换芯片,最高 160 通道
面向 AI 加速器互联、工业服务器、HPC
▎PCIe 交换芯片 · 国产阵营
2025 年底批量供货,已获 3 家客户小批量采购协议,9 家客户完成制板验证
万通发展拟收购其 63% 股权
已量产:PCIe 5.0/CXL 2.0 Retimer + PCIe 6.x/CXL 3.x Retimer(全球首发)
内存接口芯片全球第一(36.8%),Retimer 全球第二(10.9%),Switch 为新增长曲线
目前处于研发阶段,具体产品尚未发布
同时布局以太网交换芯片、PHY 芯片、智能网卡和 GPU 互联芯片
国内极少数同时掌握两类交换芯片全链条技术的企业,2026 年启动 IPO
六、未来趋势:边界正在模糊
CXL 协议基于 PCIe 物理层实现缓存一致性和内存池化。CXL 交换机的出现,让原本局限于机箱内的 PCIe 结构开始向跨机柜互联延伸。博通已推出 102.4T CXL 交换机,阿里云将发布首款基于 CXL 交换机的数据库服务器。
AMD 主导的 UALink 联盟计划在 Broadcom 未来的 PCIe Gen7 交换机上实现 GPU Scale-Up 互联,直接对标 NVIDIA NVLink。这意味着PCIe Switch 和以太网 Switch 的技术路线将出现前所未有的交叉。
NVIDIA Spectrum-X 平台和 Broadcom Tomahawk 6 CPO 的推出,使以太网在 AI 训练场景的竞争力大幅提升。RoCEv2 + 无损以太网正在逐步蚕食 InfiniBand 的市场份额。
以太网侧:盛科 Arctic 系列已进入主流设备商供应链;PCIe 侧:数渡科技 PCIe 5.0 Switch 即将批量供货,澜起科技依托 SerDes 优势积极切入。两条战线同步推进,中国交换芯片自主可控正从「能用」走向「好用」。
结语
以太网交换芯片和 PCIe 交换芯片,一个向外延伸构建网络,一个向内扩展打通总线。它们名字相似,却在协议栈、架构、延迟、带宽、距离、生态等维度上有着本质差异。
理解这对「同名异构」的芯片品类,是理解 AI 算力基础设施的关键切入点。而当 CXL 和 UALink 等新协议不断模糊两者的边界时,这两条曾经平行的技术路线,正在走向前所未有的交汇——这或许是未来十年互联芯片领域最值得关注的叙事。
数据来源:QYResearch、Frost & Sullivan、Dell'Oro Group、SNS Insider、东吴证券、东海证券、各公司官网及年报
声明:本文仅供行业研究参考,不构成任何投资建议。
881