• 正文
  • 相关推荐
申请入驻 产业图谱

AI算力集群的下一个惊爆点:OCS光交换机产业链

06/23 09:58
1320
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

【本文涉及的相关企业】Nvidia、Google、光库科技、英唐智控、凌云光、Lumemtum、Coherent、德科立、赛微电子、腾景科技

全光交换系统(OCS)的技术演进

根据摩根大通最新调研显示,目前在Meta和AWS构建的最新算力集群机组中,其数据互联的搬运传输时间也高达70%,算力芯片经常处于等待状态,传统数据传输是通过电分组交换(EPS)来互联数百万个GPU芯片,铜缆的功耗大和速率低已经严重拖累了整个系统;所以光模块和光电共封CPO应运而生,从400G到1.6T这类“电-光-电”的转换传输是目前产业格局的“局部最优解”,但是AI算力产业进一步发展(如谷歌TPU网络构建的超大规模集群),电交换芯片在推进到51.2T/102.4T(Tomahawk系列)或更高代际时,电芯片的研发周期进一步拉长,功耗与成本呈指数级上升,全光交换机拥有先发的底层系统优势,其其功耗通常低于同等带宽电交换机的一半,初始购置成本在计入配套光模块后也几乎拉平,被业界最为看好的取代光电共封CPO的技术路径。

目前OCS(Optical Circuit Switching)业内主流有四大技术路径,其商业化进程和技术局限性差异也是巨大:微机电系统MEMS)、压电陶瓷(Piezo / DLBS)、数字液晶(LCOS)和硅光波导(Si Photonics)。

○微机电系统(MEMS):作为目前业界唯一实现大规模商用放量的成熟技术 ,微机电系统通过高压驱动硅基微反射镜的机械倾角,将输入光纤的光精准反射至输出光纤,其控制方案和器件产业成熟,但是切换速度很慢(典型值在25ms左右),例如Google TPU v4 / v5 / Ironwood 都已经部署。业界主流端口规模正从128×128向320×320快速过渡,但是受限于机械结构的固有局限(翻转速率)微机电系统的全光交换机无法参与动态的数据包级(Packet-level)交换,只能用于超节点(Scale-Up、Scale-Out)的干线级拓扑场景。

○压电陶瓷(Piezo / DLBS):目前业界在压电陶瓷构建全光交换机厂商不多,凌云光代理瑞士 Huber+Suhner 旗下 Polatis压电陶瓷方案为业界领先专利技术,其通过压电效应产生的致动器二维伸缩位移,实现准直器的精确转动,并通过位置传感器构成闭环反馈控制,将2 个光纤准直器连成同一条直线,无需任何机械部件,同时起插入损耗最低、反射损耗最小,但是起扩展到超高端口阵列难度陡增。

○数字液晶(LCOS):目前来看业界对于液晶方案十分看好,其利用液晶分子的双折射效应,通过相位调制改变光束偏转方向,从而对准入射光纤和输出光纤端口。因其不需要额外的机械运动部件,可靠性远高于MEMS,且液晶技术在面板行业应用极为广泛。谷歌在最新的2026-2028年的技术指引中明确表示将会有20万台的LCOS设备需求,已明确将数字液晶与MEMS并列为共同适配的两大技术路径。但是液晶方案的切换速度还是太慢,大概在100ms左右,且在插入损耗(Insertion Loss)和偏振相关损耗(PDL)控制上更为苛刻,对复杂光学准直算法的工程依赖度极高。

•硅光波导(Si Photonics):硅光波导被业界誉为最有潜力的技术,是各大厂商实验室重点攻关的前沿方向,通过晶圆制造工艺,在硅光基底上集成热光或电光开关阵列实现微秒(μs)甚至纳秒(ns)级的极速切换,还可以透过SOA补偿插入损耗。虽然被业界看好且最有潜力,但是目前硅光波导在验证的32端口或64端口的芯片中,光波导的串扰(Crosstalk)和插入损耗非常大,即使引入半导体光放大器(SOA)阵列芯片来缓解损耗,但是串扰瓶颈仍是不小的问题,而且谷歌的技术专家也指出目前硅光波导极其缺乏跨学科的复合型研究团队攻克融合光学、材料学、电学和热力学和制程工程等诸多问题。

全球OCS产业格局

纵观全球的OCS产业格局,目前话语权全都掌握在大客户手中,以Google、Polatis、Lumemtum、Coherent和德科立等产业先锋开疆扩土,当然美资大厂几乎垄断前端设计和销售,大陆及台系厂商承担中后端制造、核心MEMS芯片高度依赖海外晶圆厂

谷歌是全球OCS最早也最坚定的大客户和行业标准制定者,在其网络拓扑中,OCS与下层自研TPU的配比达130-150:1,根据其官方供应链指引显示,新一代TPU v7的产能将大幅提升,北美和德州新AIDC的新建需求,2026年全球OCS需求量在2.5万到3万台之间,2027年预计将攀升到5万台,2026-2028年间累计需求指引高达20万台。拆解产业链全球仅有Lumentum和Coherent两家北美光电巨头作为Tier 1系统供应商直接供货,早先OCS技术先驱Calient虽曾与谷歌共同推动MEMS路线,但受限于自身产量和制造能力目前占有率进一步走低。

虽然Lumentum和Coherent垄断了系统整机的订单,但是封装制造和测试却完全没有产能,并且全球光模块市场(800G/1.6T)同样处于需求爆发期,两大巨头的产能与精力受到严重挤压,无法独立完成高难度的全整机制造。因此,他们将器件和原材料制造、大量中后端组装、自动化光学对准、激光焊接及整机测试外包给具备高精密制造能力的中国大陆和台湾的代工厂。

国内厂商在上游核心器件与材料端涉及MEMS微镜阵列、光放大器等有赛微电子主要MEMS工艺代工,光迅科技、光隆集成主要做MEMS光开关,腾景科技主要专研精密光学元件的开发,总体来说在光器件领域工艺技术壁垒极高,先发厂商的优势突出。中游端主要涉及到设备集成的封装测试,全球市场主要由Ciena等主导,国产厂商中光库科技为谷歌OCS的代工龙头,深度参与代工工艺研发和方案定制,德科立也自研光子路由引擎目前给海外厂商送样,另外还有亨通光电、拟收购光隆集成的英唐智控等厂商布局OCS领域全制程赛道。

结语

全球AI大模型对于算力集群要求日趋严苛,高带宽、低延迟的光电共封CPO已然是行业目前的局部最优解,但是真正理想的互联解决方案--OCS也离大规模商用普及越来越近,可以说目前就是OCS即将步入高速成长期的前夜,但是工艺制程和光材料仍旧是需要攻克的技术难题。

参考:

《SEMIVISION:OFC 2026 Summary -- How Silicon Photonics, CPO, OCI, and OCS Are Redefining the Physical Boundaries of Data Centers》-SEMIVISION

相关推荐