加入星计划,您可以享受以下权益:

  • 创作内容快速变现
  • 行业影响力扩散
  • 作品版权保护
  • 300W+ 专业用户
  • 1.5W+ 优质创作者
  • 5000+ 长期合作伙伴
立即加入
  • 正文
  • 推荐器件
  • 相关推荐
  • 电子产业图谱
申请入驻 产业图谱

DC革新进入深水区,什么是软件定义的分布式服务平台

2022/08/18
921
阅读需 17 分钟
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

(一)Pensando的产品定位

Pensando的四位创始人,就是鼎鼎大名的前思科MPLS四杰,分别是Mario Mazzola、Prem Jain、Luca Cafiero和Soni Jiandani,MPLS就是他们四个人的名字缩写,至于后来的Multi Protocol Label Switching缩略语,大家听听就好,虽然名字起的也不错。

Pensando在产品上线之前,非常的低调,目前能找到的相关技术资料也不多。客户覆盖了高盛、NetApp、Equinix、HPE,从国际投行,到存储和数据中心巨头,明显看得出来,客户都是精挑细选,非常有针对性。对自家公司的定位,我们可以从Pensando CEO Prem Jain,接受SDxCentral采访时的表态,一窥端倪。“它是一个软件定义的分布式服务平台,针对边缘进行加速,始终安全,并面向云、企业以及服务提供商客户”。其中的关键词是“分布式服务平台”。这里面需要注意,边缘指的是数据中心服务器等计算单元,和DC网络之间的位置,而不是大家通常认为的边缘计算。5G里面的MEC边缘计算,是指为了降低数据面的处理时延,将部分之前核心网的数据面网元,下沉到距离终端用户地理距离更近的边缘节点,进行计算、处理。问题来了,Pensando CEO所说的“软件定义的分布式服务平台”,和最近火热的DPU是什么关系,和前几年火热的分布式、软件定义又有什么关联?在回答这个问题之前,我们先来看看云计算平台的发展史。

(二)云计算和去IOE

阿里是目前国内公有云一哥,IaaS市场的市占率37.8%,IaaS + PaaS市占率38.1%,实际上当初自研阿里云,四个字可以总结:消费降级。起初国内的金融机构、政府机关和初代的互联网厂商,都是采购IOE,他们分别是IBM的小型机、Oracle的数据库、EMC的高端企业存储。

多说一句,小型机不是小号的家用台式机,而是相对于IBM早期的大型机来说,要小一号(大型机属于比较早期的产品,那是真的大),实际上小型机就是高端、定制、高可靠的数据中心服务器,IBM一般采用PowerPC架构,片内和板级总线,也都是IBM主导的总线标准。IOE产品价格普遍偏高,阿里当初作为初创企业,用户数量激增后,如果同比例采购IOE设备,是其无法承受的,所以云计算听起来高大上,实际上还是因为要降本增效。方法说起来也不复杂,就是用一堆普通的服务器,搭建高可用、分布式、大带宽、低时延的数据中心。方法说起来容易,要去IOE,属于和AWS一样的先行者,当时业界各种分布式开源生态和成熟度,远远达不到商用的要求。就是时至今日,银行证券和金融机构的数据中心,IOE依然是主角。不过数据库方面,最近一些年有了突破,Oracle和IBM的DB产品,目前已快降到50%,以达梦数据、人大金仓、神州通用和南大通用等为代表的国产数据库,正在狂飙突进,在银行、金融等ACID属性要求极高的场景,不停的吞噬国外巨头最后的市场堡垒。普通x86服务器(计算)、HDD/SSD(存储)和交换机/路由器(网络),和IOE的关键差别,在于可用性、稳定性和带宽时延这些指标上,既然是消费降级,硬件自然是要条件差一些,但是业务要求不能降低,怎么破局?硬件不够,软件来凑,云计算闪亮登场。软件定义方面,平时我们说的比较多的,是SDN、SDS,一般不咋说SDC(软件定义计算),因为计算这一块,在GPU和GPGPU普及之前,基本说的就是CPU,既然软件就是在CPU上跑的,再说软件定义计算,总有点怪怪的感觉。实际上云计算的IaaS、PaaS、SaaS,都可以理解成软件定义的分布式系统,底层技术分别对应虚拟化、容器和云原生(复合概念,可以另开一篇单说)。

(三)DC革新进入深水区

既然云计算平台,天生是分布式、去/无中心化的,Pensando所说的软件定义分布式服务平台,是不是纯属概念营销,PUA咱们“善良淳朴的客户”呢?如果不是,这个平台的必要性和存在价值又在哪里呢?

云计算从软件层面,我们可以这样简单理解,把原本一个单体程序(代码逻辑+数据存储)打散,代码逻辑拆分成微服务,分散在DC的各个计算节点上,数据存储和计算分离,通过数据中心内部的分布式存储集群,为所有计算节点提供存储服务,所有的计算和存储节点,再通过普通网卡、SmartNIC、DPU和Leaf/Spine交换机/路由器连接起来。云计算从IaaS、PaaS、SaaS到云原生,程序拆分的原来越细,微服务之间的rpc(远程过程调用)开销也随之快速提升,同时存储需求也越来越大(视频、图像等非结构化数据激增),加上存储和计算分离(HCI和SDS的优劣对比,单开一篇介绍),SSD存储的高带宽和低时延,数据中心的网络带宽被迅速拉高。从1GE到10GE,业界花了很长时间,但从10GE到25GE/100GE、400GE,乃至最新的800GE,却非常迅速,背后的技术推力,就在于分布式计算和存储架构带来的网络带宽需求。DC三大件,计算、网络、存储,就如同汽车三大件:发动机(提供动力)、变速箱(传输、分配动力)、底盘(承载车体,类比存储),三者互相依赖,任何一个都不能存在明显短板。计算方面,先说CPU服务器芯片,不管是x86至强,还是ARM Neoverse N/V系列,短期内受限于摩尔定律放缓,性能提升空间不大,先进工艺和Chiplet,可以部分延续摩尔定律,但云计算平台主要是通过IaaS/PaaS/SaaS等分布式聚合技术,掩盖性能提升瓶颈。计算方面,再来看看GPU/GPGPU和最近几年兴起的AI/ML加速器,英特尔故意压制PCIe速率和规格提升,贯彻以CPU中心的DC战略,Nvidia愤而开发NVLink,实现GPU直连,但只是解决了单机内的互联瓶颈。如何进行GPU/GPGPU的分布式和池化,关键点一方面是底层的网络互联(Nvidia收购了Mellanox),另一方面就是CUDA/AI模型的拆分、聚合(类似于大数据中的Map/Reduce模型),以及模型拆分后,如何同DPU进行整体的协同、优化。网络方面,Spine/Leaf的交换机、路由器规格在持续提升,但服务器中的TCP/IP协议栈依然是软件处理,DPDK框架可以解决内存拷贝、中断处理、内核切换等部分软件开销,但网络带宽提升太快,CPU性能提升太慢,数据中心税(DC Tax)越来越高,非云用户直接开销的Offload势在必行,比如TCP/IP、OVS,实现BareMetal裸金属。存储方面,VMWare(vSAN)和Nutanix,是HCI超融合市场双寡头,但HCI因为计算和存储统一部署,在中、小规模数据中心还可以应付,超大规模DC中,计算(CPU/GPU)和存储需求,常常是不对称,而且体量差异很大,SDS优势的更为明显。软件定义的要点,在于抽象、池化、自动化,一般是通过控制面和数据面分离,软件实现控制面的策略下发、自动部署,硬件实现数据面加速,同时软件通过下发标准动作(类似OpenFLow流表),控制数据面的实际行为。多说一句,目前的SDS,其实并不是软件定义存储,而是软件实现存储,和SDN软件定义网络的差别很大。以Ceph为例,Monitor监控、OSD对象存储、MDS文件系统Meta节点,统统都是软件实现,端到端的NVMeOF中,数据面的路径,如何和CPU、DPU、SSD主控,进行整合优化,加速器要实现哪些关键算法和处理的卸载、加速,如何同Ceph、GlusterFS、DPDK和SPDK进行协同,这里面的缘由和市场机会,得花钱才能买到。综上,目前DC的整体性能和服务提升,进入技术整合和革新的深水区,而DPU作为计算和存储节点之间的必选和关键一环,融合了网络接口、业务卸载/加速的多重角色,走到了数据中心舞台的聚光灯下。

(四)软件定义的分布式服务平台

软件定义的分布式服务平台,实际上是以解决DC典型分布式场景的整合、优化为出发点,通过软件定义的方法和DPU承载的方式,实现数据中心内,所有计算、网络、存储资源的池化、自动化和性能最大化。底层虽然是DPU来承载,但精髓和核心,在于软件定义的分布式框架。

从Pensando发布的DSC分布式服务卡和Aruba交换机来看,Pensando在创业的第一阶段,解决了底层DPU的有无问题,并根据投资方金主大客户的场景,提供了一些定制化的解决方案,还没有进入到关键的分布式框架构建,就成功上岸了。

(五)Juniper传奇再出发

聊完Pensando,再来看Fungible。如果说MPLS四杰是成功的连续创业者,那么Fungible董事会主席,则是大名鼎鼎的Juniper创始人: Pradeep Sindhu。Juniper作为和Cisco齐名的通讯巨头,能让它的创始人离职创业的,得是多大的诱惑力和市场前景。

实际上,DPU的概念就是源于Fungible,还有他们那篇著名的TrueFabric白皮书,只是后来黄教主的Nvidia收购了Mellanox以后,教主觉得这是DC的第三颗大芯片,得有一个响亮的名字,GPU是N家发明的,CPU也已经有了,就叫它DPU吧,话语权从来都是掌握在大佬手里的,DPU一炮走红。记得AMD刚收购Pensando的时候,有一篇文章,标题就是Fungible输在了哪里,大概意思是Pensando成功被收购了,起步更早、名声更大的Fungible为啥没被AMD看上呢?文章结论是Fungible主攻存储,不像Pensando重点布局P4和数据面可编程,事实真是这样吗?打开Fungible官网,看一下产品列表和解决方案,对比TrueFabric DPU白皮书,其实不难发现,Fungible和目标和Pensando非常类似,都是软件定义的分布式服务平台,而且他们走的更远、做的更深。Fungible的核心,在两点:1、以TrueFabric为技术核心,基于FCP协议,构建底层DPU芯片;2、以DPU为载体(计算和网络),面向DC典型场景,构建分布式平台。先看TrueFabric,从它的白皮书入手,不难发现其基于UDP/IP,实现了可伸缩性、低延迟、拥塞避免、公平调度、误差控制,核心在于FCP协议及其硬化实现。FCP(Fabric Control Protocol),基于UDP/IP,意味着可以兼容现有的交换机/路由器等网络节点,硬化意味着实现了媲美RDMA的时延和带宽,其实有点类似于RoCEv2。再看DC典型场景,以存储、GPU、AI/ML为例。分布式存储领域,FSC基于DPU和NVMeOF,实现了媲美Dell EMC PowerMax的IPOS和延迟指标。控制面的Composer实现元数据管理和策略下发,数据面的Storage Node,单节点可以接入24块PCIe SSD,7个存储节点 + 1个控制节点,实现1500M的读IPOS和420GB的存储带宽,额外时延只有10us,带宽、时延等各方面指标不输PowerMax。分布式GPU方面,通过GPU Connnect和类似存储的Composer节点,实现数据中心内,GPU节点的抽象、池化和自动化,当然AI/ML也同样支持。Fungible对自己的定位,“The Composable Infrastructure Company”,和Pensando的软件定义的分布式服务平台,其实非常类似,只是显然F家心更大。

(六)结语:争议和机会

目光拉回国内,前段时间看了一个DPU技术大讲堂的报告,国内的几家初创企业,比如大禹智芯、中科驭数、云豹智能、益思芯,就分别从业务需求推动底层创新、存储与加速、基础架构创新、P4四个维度,解读了各自对DPU的理解和自家产品的布局考虑。各家产品定位,明显和各自创始人的背景强相关。

再看看AWS的Nitro、阿里的神龙架构,本来也不是一张卡打天下,有Hypervisor虚拟化卸载卡,也有EBS弹性块存储加速卡,说明当前市场还处于百家争鸣的阶段,大家各自选择赛道发力,至于终点和目标,是不是软件定义的分布式服务平台,我们拭目以待。毕竟越是大机会,越是充满争议,越是小机会,反而更容易达成共识,科技发展史,几十年都是这样,最后结果会说话。

▎作者:半山

推荐器件

更多器件
器件型号 数量 器件厂商 器件描述 数据手册 ECAD模型 风险等级 参考价格 更多信息
BSP171PH6327XTSA1 1 Infineon Technologies AG Small Signal Field-Effect Transistor, 1.9A I(D), 60V, 1-Element, P-Channel, Silicon, Metal-oxide Semiconductor FET, GREEN, PLASTIC PACKAGE-4

ECAD模型

下载ECAD模型
$1.07 查看
LQG15HS47NJ02D 1 Murata Manufacturing Co Ltd General Purpose Inductor, 0.047uH, 5%, 1 Element, Air-Core, SMD, 0402, CHIP, 0402

ECAD模型

下载ECAD模型
$0.04 查看
MBR0520L 1 Sensitron Semiconductors Rectifier Diode, Schottky, 1 Element, 0.5A, 20V V(RRM), Silicon, PLASTIC, SOD-123, 2 PIN
$0.4 查看

相关推荐

电子产业图谱

「5G行业应用」是聚集TMT行业资深专家的研究咨询平台,致力于在5G时代为企业和个人提供客观、深入和极具商业价值的市场研究和咨询服务,帮助企业利用5G实现战略转型和业务重构,专注提供5G行业最新动态及深度分析,覆盖通信、媒体、金融、汽车、交通、工业等领域。