【本文涉及的相关企业】台积电、GlobalFoundries、LioniX、Silterra、iPronics、nEye 、 Salience
数据中心的硅光子
光模块在数据中心中已经使用多年,从早期的存储型数据中心到如今的算力型的横向拓展算力集群链接,光互联的比重越来越重,如上图的谷歌Jupiter网络,黄色的单模光纤(SMF)互联着数千个算力机组,每个机组在顶部都配置了一个拥有128端口的(TOR)以太网交换机,互联这个每一个TPU核心。所以大型算力集群在纵向互联扩展时,对于光模块和CPO、单模光纤和连接器需求将是海量。
据2025年光纤通信展(OFC 2025)厂商OMDIA预测过去12年间,光纤器件市场从2003年的数十亿美元(主要应用于电信领域)增长到2023年的约130亿美元,并且预计到2030年将达到惊人的250亿美元。并且行业内一个明显的现象是:铜缆正在被光纤所替代,并且过渡期将进一步缩短。这种由极细玻璃制成单模光纤可以传输单模或者多波长的光信号可以说革了电信号互联的“命”。业界光纤行业龙头康宁公司每年销售约70亿美元的光纤产品,而就在近期Meta与康宁签署了一项总价高达60亿美元的协议,未来几年一半的光纤产能被Meta全包圆了。
当然光互联自然少不了硅光子的器件了,光模块和CPO是目前互联的核心元件。可拔插光模块是一种标准化热拔插设备,一端连接到交换机或算力机组的电气接口,另一端则接入光纤网络,比铜缆拥有更低的功耗和更宽的带宽。可拔插光模块的组件主要包括:激光器、具有DSP功能和高速SerDes的CMOS芯片、硅光子调制器(通常为马赫-曾德尔调制器)和滤波器、耦合器等分立组件,目前市场主流逐渐向800G到1.6T演进。
光电共封CPO则是另一种带宽更高且功耗更低的方案,如果说光模块即将终结铜缆互联,那CPO则将取代光模块。以Nvidia的Quantum-x硅光CPO为例,在115.2Tb/s Quantum-x光交换机共有2个CPO模组,一个封装模组有Quantum-X800 ASIC、6个光学组件合计18个硅光引擎构成,Quantum-X800 ASIC具备28.8Tb/s吞吐量,基于TSMC 4N工艺达到1070亿个晶体管。CPO模组单个直连光学组件含有3个基于Interposer中阶层的硅光引擎(合计18个光引擎)和3个小型插拔式连接器,可完成4.8Tb/s吞吐量。每个硅光引擎皆采用200Gb/s微环调制器,可节省3.5倍功耗。硅光引擎中的光电芯片以3D堆叠集成在衬底上,通过光纤阵列将光信号向外部输出。此外,硅光引擎采用了TSMC N6工艺2.2亿个晶体管,单片集成1000个光子器件。
纵观业界目前主要的硅光子芯片代工厂商是台积电、GlobalFoundries(最近收购了AMF)和Tower Semiconductor。此外还有一些规模较小的厂商,例如提供原型制作服务的imec、荷兰的LioniX以及马来西亚的Silterra。国内这边中芯国际可以提供硅光子代工业务,天水华天、江阴长电、环旭电子等能提供CPO封装业务。除了业界熟知的台积电的COUPE平台,GlobalFoundries (GF)收购 AMF 后,声称已成为全球排名第一的硅光子(SiPho)代工厂,其在新加坡拥有两座晶圆厂,产能在近三年内集中释放,也被业界看好是未来和台积电分庭抗礼的强劲对手。这两座工厂主要专注于 C 波段和 L 波段的相干光器件,据GF 硅光子副总裁兼总经理 Kevin Soukup称,GF拥有一种可以在芯片上制造 45nm CMOS 以及射频和/或硅光子器件的工艺,利用其12nm FinFET工艺的先进设备来制造低损耗波导,同时还拥有类似于台积电COUPE工艺的技术,将电接口芯片(EIC)与光子集成芯片(PIC)集成到单个芯片中,但是和台积电不同的是,在芯片顶部采用光学反射镜将光纤输入的信号反射90度后连接到芯片边缘,因此不需要使用光栅耦合器。并且GF已经向其客户展示了这项CPO集成技术,以实现客户定制横向扩展和纵向扩展的光电共封CPO芯片。
细分赛道藏着巨大机遇
CMOS芯片设计需要熟练掌握代工厂的PDK和繁杂的器件库,然后加以融会贯通最终形成包含诸多子系统的大型复杂IP核。而现如今的硅光子研发则更加艰难,代工厂和研发中心都是摸着石头过河,研发工程师需要自建器件库,从SPICE开始一步步建模和仿真。所以像Synopsys和Cadence这样的公司不仅在电子芯片PDK有着强大的技术护城河,还向业界提供硅光子芯片的设计工具。所以硅光子器件设计EDA和PDK目前还是一片蓝海。
光路交换机(OCS)则是谷歌多年来一直主张使用的AI服务器"法宝",其TPU集群无需传统交换机,通过顶部的可拔插光模块直连OCS,构造三维路由结构,即可实现数千个TPU组成的集群。目前这种顶式互联方案,对于冗余、可靠性和应对不断变化的工作负载的网络重配置均验证十分有效,而该方案的核心便是MEMS(微机电系统)镜,这些微镜可接收数百根输入光纤阵列,并将光路导向数百根输出光纤中的任意一根。
业界巨头Lumentum 和 Coherent 目前也提供 OCS 技术,不过二者倒是有所区别Lumentum采用传统的MEMS微机电镜,而Coherent 则采用液晶方案。就在去年12月的一次金融会议上,Coherent 的首席执行官表示:我们非常看好 OCS,预测 OCS 的潜在市场规模 (TAM) 将达到 20-30 亿美元。无独有偶,多家初创公司也加入到OCS的开发行列里来,iPronics、nEye 和 Salience向业界透露其概念验证样品测试以交付用户进行测试,并且对于目前的OCS方案还进行了一定程度的优化,最终可能比现有架构更经济和更可靠,并且密度也大幅提升,使 OCS 能够应用于横向扩展连接,最终实现全 GPU 到全 GPU 的 OCS 连接。
同时Flex Logix的首席执行官Jeff还看好未来硅光子代工将更加向台积电等头部公司集中,通常硅光子器件脱胎于硅基器件,采用8英寸或12英寸的产线制造,目前业界工艺制程节点为65nm,SOI晶圆并带有1um厚的SiO2层用于隔离光信号。因为单模光信号主要在硅(或氮化硅)波导芯内传播,为了防止部分光场会“泄漏”到上方、侧面和下方的相邻材料中,需要加入较厚的隔离层。
为了应对信号损耗这一巨大挑战,波导输入端就需要更大的激光光源,当信号带宽和数量增多时,整体功耗将是的巨大的问题,所以控制材料的信号损耗变得至关重要。
并且硅光子晶圆代工厂还要克服诸多工艺问题,例如波导布线拥有最小弯折半径,并不能像电信号做90度的拐角,避免发生信号反射。光电耦合器和探测器的精度要非常高,并且需要用到锗材料融合到硅和氧化硅材料中,新材料的加入无疑增加了工艺开发的难度。同时调制器的微环的制造也是一大难点,SiPho和CMOS主流采用45-65nm制程节点,但是公差要求要比硅电子器件严格得多。
预计2030年,硅光子技术将在数据中心无处不在,利用硅光子技术,现在可以制造出能够对光进行复杂操控的芯片,随着制程节点的不断推进,我们将很快习惯于看到带有明亮黄色光纤的电路板布满整个算力集群。
文中插图为NotebookLM生成
参考:《silicon photonics in the data center what a cmos exec needs to know》
1307