我们对带宽无尽的欲望驱使这个行业发展得更快,不断地让网络摆脱延迟的影响

 

就像巴斯光年(Buzz Lightyear)和其他电影中的玩具一样,数据中心行业从不懈怠。我们对带宽无限的欲望继续挑战着技术开发人员,从而比任何时候都更快速、更高效地推送数据。他们不断地设计更吸引人的应用程序、流程和产品,以丰富我们的社交和工作;将日常平凡、复杂的任务自动化减少人的干预,并将这一切都融入到我们今天生活的数字网络中。这是最基础的供需关系。我们需要它,他们用这样的方式制造了一种我们从未意识到的超级依赖性。朋友经常开玩笑,说不知道在搜索引擎出现之前的我们是怎么活下来的!

 

 

是什么驱动更快、更有效的网络?基本上是我们,是人类自己!我们很容易感到无聊。我们一直在寻找新的、更具互动性的方式来自娱自乐,用一种前所未有的、更令人兴奋的、更吸引人的交流方式沟通,我们期待这一切立刻发生。即刻现在。我们不再用电话与人交谈。短信已经过时,图片信息也迅速成为昨日黄花。如果你想和孩子们打成一片,那就尽可能多地播放流媒体为主的内容,日以继夜。而不止于此。我们想在信息高速公路上连接更多的设备,我们想要改进的分析内容,我们想要更多的机器为我们做比想象还要多的事情,我们希望所想即所得。

 


我记得在 2010 年,IEEE 批准了 40Gb 和 100Gb 的数据,当时我就想,我们根本没有必要使用这么高的速度。以今天的标准来看,那时的宽带简直就是可怜——就像试图用吸管来吹一个巨大的气球一样——但在当时已经够用了,因为当时我的带宽消耗量远不及我今天生活所需的带宽需求。但当我的孩子们开始使用他们的手机、平板电脑和在线游戏平台时,我可怜的小铜线连接就开始抱怨别人对它的要求了。谢天谢地,现在光纤传输速度超过了过去的 30 倍,虽然家里的设备越来越多,但是我总是可以做的更多,很多,很多!

 

让我给大家介绍一下技术路线图的背景,让大家了解一下我们今天的情况。直到 2010 年,生活都很简单。我们在光纤网络上运行 10Gb,使用 1 芯光纤发射和 1 芯光纤接收。无论什么样的终端设备,还是部署了哪个收发器,都不重要,因为它们的操作都是一样的。然后 IEEE 批准了 40Gb,使用了一个不同的 PMD(Physical Media Dependent)接口与并行光学方案。

 


并行光学

与串行(双工)传输不同,并行光学使用 8 芯或更多的光纤,而不是传统的 2 芯光纤。我们在 4 芯光纤上发射信号,每芯光纤 10Gb,在另外 4 芯光纤上接收,每芯光纤 10Gb,以达到我们的 40Gb 聚合速度(称为 40G-SR4)。由于 2010 年速率最快的交换机 ASIC(application-specific integrated circuits)是 10Gb,要达到 100Gb(即 100GBASE- SR10)且同时得到批准,我们需要 20 芯光纤,每 10 芯传输 10Gb,另外 10 芯接收 10Gb。值得庆幸的是,在 2015 年 IEEE 批准了 100G-SR4 通过 4 芯光纤传输 25Gb,并通过另外 4 芯光纤接收 25Gb,使用了与 40GBASE-SR4 相同的 8 芯光纤平台,从而达到了我们的 100Gb 总速。随后我们向 200G 迈进,最终实现了 400G,且光纤数量和通道的一致性仍在继续。

 

因此,现在这个永不间断的行业,让网络管理者和用户需要作出选择:随着越来越多的技术和解决方案选项的出现,需要针对部署什么样的基础架构解决方案做出关键决策,以确保无缝地迁移到更高的速度。现在,我来帮您把它们分解一下。

 

BiDi

在 IEEE 批准 40&100Gb 的三年后,2013 年底,思科推出了 40G BiDi,该技术由 Avago Technologies 开发,现在是富士康互联技术公司(FOIT 的一个业务部门)的一部分。这项开创性技术是为了使现有的两芯多模光纤能够在数据中心设施中使用 WDM(波分复用)技术。为了实现 40Gb 传输,两个 20Gb 信号在同一条多模光纤上,但波长不同,在 850nm 和 910nm 处“双向”发射和接收 20G 信号,因此得名 BiDi。我们在 2018 年看到了 100G BiDi 的发布。

 

UNIV

在 BiDi 发布后不久,Arista 和 Juniper 推出了他们的 40Gb 通用收发器(UNIV),使用另一种 WDM 技术在一对光纤上运行。这一次,它在传统的单模 1310nm 区域单向发射了 4 x 10Gb,中心波长为 1271、1291、1311 和 1331nm,但仍然可以通过一对多模光纤或单模光纤传播(因此有了 UNIV 这个名字)。

 

SWDM4

我们的第三个 WDM 方案是 SWDM4。使用与 UNIV 相似的 4 波长方法,关键区别在于它们在更传统的多模光纤的 850nm 区域发射,中心波长为 850、880、910 和 940nm,可选择 40Gb 和 100Gb。

 

200Gb 也有 WDM 选项,但关键是与并行光学不同,并行光学是一个被 IEEE 标准完全认可的标准。这些仍是专有技术,或者作为 MSA(Multi-Source Agreement)的一部分,不能彼此互联,也不能与任何标准许可的收发器相互兼容。BiDi 必须连接到另一个 BiDi,UNIV 必须连接到 UNIV,以此类推。这有可能严重限制网络管理者在寻求下一个速率迁移时可用的选项,通常“供应商锁定”在某一个制造商,并限制我前面提到的那些关键基础设施选择。

 

有清晰的记录表明,使用低成本组件的并行光学器件总是首先投放市场,3-5 年后才会有 WDM 同类产品随之上市。如果您决定采用 WDM 的双光纤网络策略,而您的企业和客户恰好需要技术升级,如果 WDM 产品还没上市,您还有什么选择?

 

要么暂停直到其发布上市,但这会影响公司的收入和声誉;要么升级网络以支持并行光纤部署。但是,如果您现在已经有了并行光纤网络(即使您仍在遵循 WDM 路径),您可以选择在同一个布线设备中使用这两种技术,而无需进行任何计划外升级。

 

调制技术

传统的 NRZ 调制(不归零)使用 0 和 1 两个值。把它想象成一个灯泡是发射器,而你的眼睛是接收器。你只需要开灯或关灯作为信号,但如果你的眼睛和我的一样糟糕,那么随着速度的提高,识别或接收信号会变得困难重重。为了满足 100G 的传输速率,PAM4(Pulse Amplitude Modulation)被开发出来,它使 NRZ 的速率加倍并简化, 使用 4 个离散值 00、01、10 和 11 将灯调亮、打开到最亮、调暗和关灯。PAM4 用于某些(但不是全部)100G 选项。然而,这将成为 400G 的标准。值得注意的是,随着速度的提高,我们可能会看到其他调制技术的引入。

 

现在为了使这篇文章不像畅销小说那样长,我只提到了以太网和不同的多模选项。请注意,单模并不意味着更容易。在 40G 问世之前,单模一直是 2 芯光纤,就像我们传统的多模。和多模一样,我们开始看到了 40G 甚至更高速率的单模的并行光收发器选项的出现,这是因为用户需要更长的传输距离,但仍然想要利用端口突破能力——因此就采用了更大的速率端口并将其分为 4 个较小的速率端口,以获得更低的总体成本。与传统单模 10km 的距离相比,500m PSM4 的距离更短,因此成本更低。

 

当前的行业趋势是,一旦产量开始稳定,部署高速并行光学并将其拆分出每个端口的成本与使用原生速度光学器件(例如,1 个 100G 分为 4 个 25G 而不是 4 个 原生 25G)相比会变得更低,且速率越高,因此成本效益就越高。此外,端口分支实现了更高的密度,同时降低了电力和冷却的能源成本。

 


400G——我们的今天

正如我前面提到的,我们对带宽无限的欲望驱动了这个行业实现了更快的速度、更短的延迟。人工智能(AI)和机器学习(ML)、无服务器计算、分布式闪存和更快的服务器 CPU/GPU/FPGA 的激增都是驱动 400G 发展的因素。例如,Broadcom 的 Tomahawk III ASIC 支持 12.8Tb/s 或 128x100g 光信号,并且还在对 25.6Tb/s (256x100g)、51.2Tb/s (512 x 100G)和 102.4Tb/s (256x400g)进行开发。

 

将越来越多的吞吐量压缩到同一个内存中,提供了比以往更快地处理数据的机会,满足了我们指尖对速度的需求。但这并非没有挑战,您将在下面的表格中看到,我们提供了几种不同的选项来支持距离、通道和光纤类型。

 

以下是 IEEE 标准发布或仍在开发的所有 400G 光学 PMD(Physical Media Dependent)列表:

 

400G 光学

 


除此之外,2016 年还形成了两个 MSA 标准,考虑了 400G 收发器的物理尺寸和形状,由 8 个通道连接。MSA 为了研究连接形式而考虑了收发器的物理尺寸和形状,以及收发器的封装形式。它们是 QSFP-DD(Quad Small Form-Factor Pluggable – Double Density)和 OSFP(Octal Small Form-Factor Pluggable)。康宁是这两个 MSA 标准成员。

 

QSFP-DD - http://www.qsfp-dd.com/

QSFP-DD 使用与 QSFP28 相同的外形物理尺寸,因此在使用相同的板卡时可以完全兼容。在光纤接口方面,最新规范(2019 年 7 月 5.0 版)列出了以下选项:

 

  • 公头 MPO

 

MPO-12 单排

 

MPO-16 单排

 

MPO-12 双排

 

  • 双工 LC

 

  • 双 CS

 

  • MDC*

 

  • SN*

 

*MDC 和 SN 是新一代极小型连接器,于 2019 年初推出,将在另一篇文章中进行介绍。这些都是由超大规模运营商驱动的,他们希望在收发器上直接把 400G 分支为 4x100G 的光路。

 

OSFP - https://osfpmsa.org/.

OSFP 的外形设计考虑了更高的速度(QSFP-DD 和 OSFP 都可以处理 800G 的散热),因此其占用空间比 QSFP-DD 稍大一些。这主要是因为在收发器顶部有一组额外的散热片,用来发散由于更高的功率要求而产生的更多的热量(请注意,QSFP-DD 已增加了散热片的设计以来散发更多热量)。温度的升高对于 QSFP-DD 和 OSFP 来说是一样的,典型的要求是 8-15W 之间的多模模式。为了实现兼容 QSFP28,您需要使用适配器。

 

2019 年 1 月 OSFP 规范列出了:

 

  • 公头 MPO

 

MPO-12 单排

 

MPO-16 单排

 

MPO-12 双排

 

  • 双工 LC

 

  • 双 CS

 

细心的人可能已经注意到 PMD 与 MSA 中列出的选项不一致,完全正确。事实上,虽然 MSA 中列出了不同的光纤接口,目前只有针对 CS、MDC 或 SN 接口的收发器,对于多模 LC 尚无确定的解决方案,只有 500m、2km 和 10km 的单模。

 

 “那么,我们什么时候能看到 400G 收发器普遍上市呢?”我听到你们的需求了!我们在 2019 年初看到了 Arista 和 Cisco 的声明,预计产品将在 2020 年交付。Arista 已经宣布了 QSFP-DD 和 OSFP 的选项,Cisco 仅针对 QSFP-DD。

 


结论

对于阅读本文的许多人来说,飞向无限,更确切地说是 400G,似乎是一个相当遥远的距离。然而,我们都逐渐意识到,在 IT 行业,我们永远不会停止追求极限,我们都必须接受这样一个事实:我们今天所热爱的将很快成为昨天的记忆。

 

在过去的 9 年里,我们经历了比前 30 年更多的网络速度提升(接下来还会有更多)。有了这么多选择,用最灵活和可扩展的光纤基础设施规划正确的技术迁移路径,应该是您的首要任务。如果您不这样做,您可能会发现自己不得不继续投资额外的光纤布线,因为支持下一次技术更新的光学器件还没有开发出来。

 

您可不能打盹放松,引用《玩具总动员》里的玩具们讲的一句话:“我们无处不在!”

 

Anthony Robinson 是康宁光通信全球数据中心的市场开发经理