加入星计划,您可以享受以下权益:

  • 创作内容快速变现
  • 行业影响力扩散
  • 作品版权保护
  • 300W+ 专业用户
  • 1.5W+ 优质创作者
  • 5000+ 长期合作伙伴
立即加入
  • 正文
    • “一年完成三轮大体量融资”的背后
    • 专用DPU =定制化=不通用?
    • DPU=智能网卡?
    • 超低延时是一大核心需求
    • 攻克三大挑战的路上
    • 写在最后
  • 推荐器件
  • 相关推荐
  • 电子产业图谱
申请入驻 产业图谱

万元计价的DPU,最后一道商业化屏障如何破?

2022/10/18
3034
阅读需 13 分钟
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

2020年,英伟达以69亿美元收购以色列网络芯片公司Mellanox,并于同年推出其首款DPU产品,定位于CPU和GPU之后的“第三大算力支柱”——至此引燃DPU市场。两年来,DPU在国内外的热度迅速蹿升,国际巨头在迅速布局:Intel推出IPU基础设施处理器,今年又传来AMD以19亿美元收购DPU芯片厂商Pensando;国内市场也是如此,玩家纷纷布局、资本分外青睐。

“一年完成三轮大体量融资”的背后

国内DPU公司中,中科驭数布局较早,创始团队在计算机体系结构领域有近二十年技术积累,在产品量产、商业落地、生态构建、以及相应的标准推动等方面较为先行。

日前,中科驭数宣布完成数亿元B轮融资,并同时公布第二代DPU芯片K2预计将在10月回片。据了解,该轮融资达到了超以往轮次融资规模的数亿元,由金融街资本领投,建设银行旗下建信股权跟投,老股东灵均投资、光环资本、泉宗资本连续三轮追投。

这也是过去一年内,中科驭数完成的第三轮大体量融资。融资和产品节奏都稳健的中科驭数,关键优势是什么?

追溯起来的话,该公司创始人兼CEO鄢贵海博士、联合创始人兼CTO卢文岩博士,均来自国内的科研院所。他们提出了软件定义加速器技术(Software Defined Accelerator),自主研发了KPU(Kernel Processing Unit)芯片架构,并于2019年设计出业界首颗数据库与时序数据处理融合加速芯片,已经成功流片。中科驭数的DPU芯片,正是基于自研的KPU芯片架构,具有网络协议处理、数据库和大数据处理加速、存储运算、安全加密运算等核心功能。

在技术路线方面,中科驭数2018年提出了“软件定义加速器”,采用自主研发的敏捷异构KPU芯片架构。相较于传统的ASIC或SoC DPU芯片架构,KPU有较高的灵活性,可以通过即时的软件配置来定义芯片内部数据运算逻辑,在保障充沛算力的同时,以最低功耗支撑更多运算负载类型。在解决专用处理器设计碎片化问题的同时,异构众核的技术架构具有软件定义可配置、设计周期短、性能更优、计算高效的优势,据称目前已经研发积累了百余类功能核。

专用DPU =定制化=不通用?

从被提出以来,DPU一直伴随着“专用”这个字眼。鄢贵海分享,他被不止一次地问过:既然DPU是一颗专用芯片,是不是意味着应用比较有限?通常需要通过定制化才能实现?它是不是非标准产品?是不是不够通用,不能跟现有的生态环境很好地兼容?

对于这些问题,鄢贵海认为有一定的片面性,甚至是认知误区。他指出,本质上,“专用化、定制化、标准化”是三个完全不相关的概念。“专用化”强调的是应用场景;“定制化”是实现一项技术的路径选择;“标准化”的背后则是工程化,其实是为了降低边际成本。至于要不要定制化?可能很多时候取决于两个因素:一是通用产品具不具备实现系统功能所需的支撑;二是成本问题,如果定制化可以让成本更低、性能更高,其实是没有理由非得用已有的标准组件去实现的。

基于他的解读,不难理解DPU所说的“专用性”主要是针对应用场景而言,并不能简单等同于定制化产品。那么,究竟该如何理解这个所谓“第三颗算力芯片”的功能定位和产品属性?

英伟达给出过一个定义,可以说比较准确地描述了DPU的功能,也相对容易理解——“DPU是用来把数据在正确的时间放到正确的位置”。

该如何理解? 鄢贵海认为,正确的时间指的是延迟必须要满足要求,带宽要能达到数据量,自身的数据带宽要做到匹配;正确的位置指的是要把所有的远程资源都能本地化,所有的跨节点访问都要做的跟访问本地资源是一样的。

“其实,DPU是什么不重要,重要的是DPU能做什么”,鄢贵海在帮助厘清DPU概念的同时指出,“从我们开始做DPU,就在试图回答DPU是什么,而每一年我们对DPU的认识都在加深。”

DPU=智能网卡?

数据中心服务器之间的网络互联有一套底层软件系统,这套软件需要能完成网络互联协议,除此之外,还需要能跑一套数据中心必备的网络安全系统。传统上,这些处理跑在CPU上,而随着智能网卡(SmartNIC)的逐渐普及,它正在网络安全和网络协议处理方面帮助CPU卸载任务。这与DPU的功能有着极高的重合,因此业界也有人认为DPU就是智能网卡,或者说是增强的智能网卡。

那么,DPU与智能网卡的区别究竟是什么?是“新瓶装老酒”吗?卢文岩博士指出,可以说DPU是智能网卡中的核心芯片,或者说智能网卡是DPU的一个应用场景,而事实上,DPU不仅仅是这一个场景,还可以用到更多地方。

至于相较于智能网卡的优势是什么?卢文岩表示,主要体现在资源和性能方面。现在市面上基于FPGA的智能网卡,基本都卡在了20G和25G带宽之下,很难突破达到两个100G的带宽。这主要因为几方面限制:首先是FPGA性能上不去,频率很难超过300兆;其次是资源有限。因此,从性能和延时都没法和DPU芯片比拼。而中科驭数的K2芯片,已经实现了200G带宽和1.2微秒延时。

他补充,今天不管是云、数据中心,还是混合云、私有云等,大部分倾向于DPU+CPU的方向。这是因为如果想让数据中心的带宽更好、延迟更低,就要搭建高速网,而这会加剧成本压力。如果用新的DPU方案,能够把基础打好,应用灵活性更强。特别是对一些底层基础能力很强的集成商,通过部署DPU,他们甚至可以重构基础设施底层的软件,例如控制链、转发链等都可以在DPU场景下重新做分布,这对优化未来整体系统性能至关重要。

超低延时是一大核心需求

关于DPU未来的应用方向,中科驭数高级副总裁张宇表示,从数据中心到云原生,再到算力网络元宇宙自动驾驶等,都将是DPU蓬勃发展的领域。

“在没有DPU的时候,一些工作都是CPU在承担。但是有了DPU之后,超低时延和超大带宽,这其中不管哪一个场景都要做到极致,因为这才是DPU芯片的核心”,张宇认为。

过去几年,中科驭数一直在深耕超低时延场景,一个典型应用就是金融科技。而这一市场几乎被AMD和英伟达所占领,AMD占到90%以上的市场份额,剩下的几乎被英伟达占据,思科也仅分到了很小的“蛋糕”。作为国内甚至是唯一在这个市场“冲浪”的玩家,中科驭数的底气是什么?又收获了什么?

张宇表示,这首先离不开扎实的技术基础,中科驭数自研的软硬件一体化加速平台,具备超低时延、高吞吐、低抖动、高稳定、高安全等优势。在超低时延领域,驭数产品商业环境实测均值仅为1.12微秒,创下全球超低时延最快纪录,因此能够在金融极速交易、金融风控、极低时延数据库异构加速等应用中落地。

其次是自研的软件开发平台HADOS,助力产品实现了灵活度高、稳定性强、兼容性好,能够全面适配国内外多种操作系统,大幅降低应用软件开发难度。

他透露,基于已有技术储备和生态布局,中科驭数有望推出云原生服务网格全面加速方案,对比当前的解决方案,时延性能可以提升5-10倍,为实时性要求极高的数据中心、工业控制、车路协同等应用场景提供技术支撑。

攻克三大挑战的路上

为了帮助行业认识DPU并推动它的标准化发展,中科驭数做了两件事:2021年发布了行业首部DPU技术白皮书,2022年推出行业首部DPU评测技术白皮书。

DPU能否标准化?鄢贵海表示,DPU肯定是个好东西,标准化也能做成,但是有挑战。从算力发展的三要素来看:首先性能必须高。第二,生产率如何,这背后其实是工程问题,就是能不能把系统做得更好用,兼容性做到最广。第三就是成本,也就是能不能很好地规模化,做到供应链可控、每个环节的成本都相对较低,以及售后体系更优化。

作为初创公司,鄢贵海认为一定是从上述第一个要素开始的,不论核心架构,还是核心软件的积累,首先要解决第一个问题。

他坦言,中科驭数目前主要在解决第二个问题,因为现阶段不论是软件的频繁迭代,还是做国产品牌的广泛适配,都要解决DPU好用、易用的问题,从而在各个应用场景中用起来。

而接下来要解决的就是成本问题——DPU目前还没有大规模上量,不过,从它的应用空间来看,最后的规模用量不会低于服务器的量,这也意味着还有很大的空间通过规模效应来降低成本。

“这也是中科驭数从现阶段基本形成商业闭环,到变成一个在整个产业中有重要位置的公司,要突破的最后一道屏障”, 鄢贵海指出。

据了解,目前中科驭数在商业化拓展方面,围绕“垂直深耕,水平扩展”的策略,产品和方案已实现了一定的规模化商用,仅2022上半年订单已经达到了2021全年的两倍。

对于明年的预测,鄢贵海认为,看起来市场只会加速发展,目前终端用户对DPU的应用认知已经达到了一定水准,市场需求确实存在,前期的市场教育奏效了,客户也愿意真金白银去投入。未来,他们在最终做产品决策时,最重要的选择依据肯定还是整体的性价比,即性能是不是够好,价格是不是足够有优势。

这对于中科驭数这样的第三方DPU厂商来说,就要把产品结构做得更完善、方案整合得更好、软件更稳定易用、设备更完善,而这些最后都会成为产品的核心竞争力。“看起来很多需求是碎片化的,但你整合好以后就会变成你的核心竞争力。相反,看起来相对短平快的路径,最后就会可能变成自己的天花板”, 鄢贵海表示。

写在最后

对于DPU的应用量级,业内有一些公开预测,认为用于数据中心的DPU量级将达到和数据中心服务器等量的级别。一台服务器可能会有一颗或者多颗DPU,好比每台服务器必须配网卡一样。以服务器每年新增大约1500万台来看,每颗DPU如果以万元计算,将是千亿量级的市场规模。

行业在不断定义DPU,DPU也在重新定义行业。突破商业化的最后一道屏障,DPU将迎来真正广阔无垠的蓝海。

推荐器件

更多器件
器件型号 数量 器件厂商 器件描述 数据手册 ECAD模型 风险等级 参考价格 更多信息
640905-1 1 TE Connectivity (640905-1) RECEPT,PIDG FASTON 16-14 250

ECAD模型

下载ECAD模型
$0.85 查看
SI2319CDS-T1-GE3 1 Vishay Intertechnologies TRANSISTOR 4400 mA, 40 V, P-CHANNEL, Si, SMALL SIGNAL, MOSFET, TO-236, HALOGEN FREE AND ROHS COMPLIANT PACKAGE-3, FET General Purpose Small Signal

ECAD模型

下载ECAD模型
$1.25 查看
CRCW04020000Z0EDHP 1 Vishay Intertechnologies Fixed Resistor, Metal Glaze/thick Film, 0.2W, 0ohm, Surface Mount, 0402, CHIP, HALOGEN FREE AND ROHS COMPLIANT

ECAD模型

下载ECAD模型
$0.15 查看

相关推荐

电子产业图谱

与非网资深行业分析师。主要关注人工智能、智能消费电子等领域。电子科技领域专业媒体十余载,善于纵深洞悉行业趋势。欢迎交流~