【湾芯展推荐】本文涉及的相关厂商:OIF、Eoptolink、Innolight、TFC、Lumentum、Fabrinet、Applied Optoelectronics、Accelink
何为光模块
光模式是由光电子器件,逻辑功能电路和光纤接口等组件组成的光学信号收发于一体的专业设备,其核心功能是,作为发送端:将电信号经过驱动芯片和激光器调制成光信号发出,作为接收端:则将光信号转化为电信号传输给跨阻放大器等电路处理。早先算力机组通过铜缆中电信号可以满足短距离低速率的电学互联,低廉的成本和不高的速率以及可以接受的衰减是小型算力群组构建的最优解。
随着AI与数据中心的爆发式增长,大规模GPU集群和高性能计算组网需要高带宽、长距离、低延迟的互联能力,铜缆的能力根本无法满足,业界自然将目光聚焦到天生极低衰减且可以波分复用的光缆上,并配套光电-电光转换、信号调制和放大处理等电路模块,从而形成一套行业规范化的模组型设备,实现大型算力集群的长距离、高带宽互联。
FOMO研究院则清晰的给出了数据传输的四个阶段,普通家庭用1G带宽可以满足4k流媒体的不卡顿观影体验;云服务器厂商为了满足巨大的数据流量则需要100~400G左右的带宽来满足每秒钟数以万计的请求;AI算力时代需要进行模型的训练和推理,其构造GPU之间的万卡互联所以需要800G或者1.2T的光模块,这也是现阶段行业的主流带宽。而下一代挑战则是1.6T~3.2T的更大带宽互联,AI大模型从“图片”进化到“视频”,模型也进化到“亿万参数”时代。
光互联与铜互联的“战争”也从100G到如今主流的800G再到未来的1.6T~3.2T不断进行着“战线”的推移,光模块就是目前主流800G战场的“王牌部队”。而当我们去看具体的一个光模块时,又会被其“部队番号(光模块产品型号)”看的眼花缭乱。
命名规则详解
光模块在行业规范的命名标准源自于IEEE的以太网工作组,通过IEEE 802.3标准(该项标准不是单一行业标准,而是包含各种修正案的完整系列)定义PHY层的电气和光学规范,在PHY层面,该标准定义了信号传输中使用的电气和光学特性-如光功率、链路预算、可接受误码率和信号编码。那么采用不同信号速率、传输距离和光纤模式的产品也就需要一套行业规范命名规则,但是因为行业发展及其迅速,所以没有完全严格的定义,一直是不断的补充与修正,本文则是选取行业比较通用的格式,来详解下:
[外形规格]-[基带速率]-[传输距离]-[通道数]-[调制方式]-[多路复用]-[光纤模式]-[其他信息]
上图中产品名称为:OSFP-800G-FR4 800G OSFP FR4 (200G per line) PAM4 CWDM Duplex LC 2km SMF,是目前主流量产的800G OSFP的光模块,支持2公里距离,当然价格也十分昂贵,下面就让我们逐一详解认识一下吧。
1.[外形规格]
产品名的第一部分直接表明光模块的外形规格,OSFP为 Octal Small Form-factor Pluggable,八通道小型可拔插连接器;QSFP的Q则指代quad,表示四通道;QSFP+则是QSPF同样外形规格的更快版本。此外QSFP(56/112)-DD则是巧妙的在四通道的外形规格下实现八通道的总带宽翻倍,通过创新型的双排电气触点设计,将模块连接器的金手指触点设计成上下两排,从而使本该四通道容纳四对差分信号线变成了可以容纳八对信号线,而且在400G带宽互联网络中,QSFP-DD应用相当广泛。800G网路中,OSFP则更为主流;1.6T会有OSFP-XD(超密集),并且业界在800G带宽以上更倾向于光电共封CPO来替代可拔插光模块。
2.[基带速率]
基带速率又称为聚合数据速率(Aggregate Data Rates),通常名称中200G、400G就是表面该模块的总数据速率,对于单通道的SFP+来说,基带速率就是单通道的速率即10Gbps;对于四通道的QSFP28为例,模块的总速率为通道数x单通道速率则为 100G=4x25G,所以如下图所示可以看出互联基带速率来到了800G和1.6T的时代,为了满足AI算力集群的互联算力,除了提升单通道的互联速率,还不断增加系统的通道数,以求获取最大的基带速率。
3.[传输距离]
业界将光通信的距离不同分为了九个等级,从数据中心单个机架内常用的极短距离(VSR),到最远距离(ZR)的可在数百公里范围内工作的互连。并且目前业界其实没有严格将距离等级界限分开,实际应用很多时候都取决于数据速率、调制方案和光纤信号质量。常用的SR、FR、LR、ER、ZR一般如下含义:
•SR(Short Reach):短距离,通常用于数据中心内部,传输距离为100米至300米。
•FR(Far Reach):中距离,通常是互联骨干网,传输距离为2公里
•LR(Long Reach):长距离,通常用于城域网,传输距离为10公里。
•ER(Extended Reach):超长距离,传输距离可达40公里。
•ZR(Zoned Reach):极长距离,传输距离可达80公里或更远。
在复杂的工程环境下,随着互联距离不断提升,光信号的传输损耗也会增加,行业通常会搭配不同的波长和光源,如下表则详细给出了九个距离等级和其光源等不同对照。
4.[通道数]
通道数和基带速率有着密切关系,在高带宽速率场景下,数据几乎总是通过多个并行光链路发送和接收的,所以上述例子中OSFP-800G-FR4 (200G per line) PAM4 OSFP则为八通道每通道200G,总带宽不应该为1.6T吗?是不是笔者写错了呢?其实不是的,这里的通道数是光学通道,也就是说这个800G模块拥有电学通道8个每通道为100G,而光学通道为4个,每通道为200G。由于需要满足IEEE 400GBASE-FR4 行业标准和实现更优的光纤资源利用率,只需要一对单模光纤(Duplex LC接口,2根光纤)利用波分复用实现了4波长通道的
5.[调制方式]
调制方式指的是将电气信号0和1转换为光信号的方法,在低速率互联时,采用NRZ这种开闭光源作为脉冲信号传输非常简单且高效。但是当数据速率在100G及以上时,光纤会扭曲信号,且对开关速率也有新的要求,所以在长传输距离和高互联速率上,业界会采用PAM4,4级脉冲幅度调制(4-level Pulse Amplitude Modulation),通过改变激光器驱动电流大小,来获得不同级别的激光输出,对应不同的两位比特数(00、01、11、11)所以PAM4具备更高的传输效率,在相同码率下,PAM4的波特率只有NRZ信号的一半,大大降低了信号在传输信道中的损耗。
当然在驱动激光调制还有更多更深层次的可以值得讨论,对于温度及其敏感的激光器而言,直接驱动会在激光器开启阈值处产生信号失真,随着不同注入电流其光学输出功率也不同,对于长时间满载的算力群组来说,则需要精密且稳定的温度传感器和反馈控制电路来调整驱动电流,确保时刻调制的输出激光信号功率一致。业界为了获取稳定可靠的激光信号,通常采用外置激光器方案,并且搭配不同的调制器如电吸收调制器、马赫-曾德尔调制器、环形调制器来获取高质量的调制信号。(有关于外部激光光源和不同调制技术的详细介绍可参看公众号往期文章)
6.[多路复用]
由于不同波长光波在同一根光纤中传输不受干扰,所以光路相比于电路可以将多路独立并行的信号通道放在一路光纤中传输,例如CWDM(Coarse Wavelength Division multiplexing)粗波分复用,可以将1271、1291、1311、1331nm四个波长的信号在单根光纤上同时传输。
实现并行连接更直接的方法是多根物理光纤连接,早期的并行单模PSM(Parallel Single Mode)就是采用多路并行传输同一波长信号,但是其需要大量光纤和多个光纤接口,因此成本也高出数倍。而对于超长距离(ZR、ZR+)互联,则要采用更加复杂的DWDM(Dense Wavelength Division Multiplexing)密集波分复用,在光纤衰减最小的 C 波段(1530 nm - 1565 nm)和 L 波段(1570 nm - 1610 nm)波长间隔极小的实现40 波、80 波、甚至 160 波的超大容量传输,并通过掺铒光纤放大器(EDFA)对所有波长同时进行光放大,实现数千公里的超长距离传输。
7.[光纤模式]
光互联网络的光信号主要载体为光纤,主要有两种类型:单模光纤(Single Mode Fiber,SMF)和多模光纤(Multi Mode Fiber,MMF),使用VCSELs(vertical cavity surface emitting lasers垂直腔面发射激光器)宽锥形的激光束耦合到直径几十微米的多模光纤MMF中,不同入射角度的光线,将会在光纤中不断反射前进,所以一次脉冲信号有可能在终端不同时到达,称之为脉冲扩散。所以多模光纤不能够发送紧密间隔的脉冲信号,业界又开发了OM3、OM4的梯度折射率光纤,其玻璃芯的折射率随着距中心的距离而连续减小,这样以来可以减小长互联距离的光信号脉冲的扩散。
由于跨城域的算力集群需求,长距离互联场景则采用单模光纤SMF,其直径通常为8到10微米几乎没有模间色散,搭配DFB或者EML激光光源可以实现超高速传输和长距离互联。多模光纤MMF常用于850nm,单模光纤SMF多用于1310nm或1550nm,这也是一个很好区分的点。
8.[其他信息]
当然除了上述标准的信息命名中往往还会有一些其他信息,例如本文中OSFP-800G-FR4 800G OSFP FR4 (200G per line) PAM4 CWDM Duplex LC 2km SMF中Duplex LC则意为双工LC连接器(LC连接器是Lucent所生产连接器接口类型)。而有些也会在最后写明例如热插拔支持、数字诊断监测、多速率支持和特定协议支持等详细信息。
结语
本文详细介绍了光模块的命名法则,当初学者进入光模块行业时会对眼花缭乱的命名方式非常疑惑,当你通读全文后知晓每段专有名词和数字所指代含义时,就能够快速判断出哪款才是适合特定应用的光模块。
*参考资料
1.《A Complete Guide to Optical Transceiver Nomenclature》
2.Fibermall.com
3.《OIF行业标准》
4.《info-finder》
166