加入星计划,您可以享受以下权益:

  • 创作内容快速变现
  • 行业影响力扩散
  • 作品版权保护
  • 300W+ 专业用户
  • 1.5W+ 优质创作者
  • 5000+ 长期合作伙伴
立即加入
  • 正文
    • 三大场景、五大方案,国产DPU交短期答卷
    • 三U一体——未来算力底座的核心
    • DPU产业有望迎来飞跃
  • 推荐器件
  • 相关推荐
  • 电子产业图谱
申请入驻 产业图谱

国产DPU创业怎么样了?产业落地三大场景可期

04/03 19:42
1918
阅读需 14 分钟
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

随着数据量激增和应用场景走向多样化,算力需求不断攀升,算力瓶颈成为业界关注的焦点问题。

如果将数据中心中的每一台服务器比喻为一座“城市”,在每个城市“人口”不断膨胀,城市间交互需求爆炸式增长的背景下,以CPU为网络核心的数据处理方式,面临的挑战越来越大。DPU因此而名声大噪,对比传统网卡,它相当于帮助数据中心完成了从“乡间公路”到“高速铁路”的转变。DPU所提供的高吞吐、低时延、基础设施卸载能力,能够帮助数据中心规避“信息孤岛”问题,被认为是数据中心继CPU、GPU之后的第三颗芯片,成为未来算力底座中的重要支柱之一。

DPU的发展潜力,让国内创业者们看到了新的方向和希望。短短几年,至少十几家创业公司已经站上了这个赛道。不过,大芯片创业并非易事,产品从雏形到流片,再到落地、以及在客户项目中批量应用,要经过技术与时间的双重考验,并且,所面向的都是被国外科技巨头(比如英特尔、英伟达、AMD、Marvell等)长期占据主导优势的应用领域。可以说,每一关,都是生死线。

那么,经历了几年“花团锦簇”的发展热潮,DPU创业究竟怎么样了?是“乱花渐入迷人眼”,还是目标日益清晰?能否经得起实际场景的拷问?日前,中科驭数在以“DPU构建高性能云算力底座”为主题的线上技术开放日上,用实际的产品和解决方案交上了一份阶段性答卷。

三大场景、五大方案,国产DPU交短期答卷

中科驭数作为国内专注于DPU研发设计的公司,基于自研KPU架构已经进行了三代DPU芯片研发。在当天的技术开放日上,中科驭数集中展现了在低时延网络、云原生网络及智算中心网络三大关键场景下的技术成果,并深入介绍了五大核心DPU解决方案:高性能云原生底座方案、基于DPU的极速服务网格方案、高性能国产密码卸载方案、RDMA加速并行文件系统解决方案、以及证券期货交易信创低时延网络解决方案等。

“DPU是解决数据中心计算效率低、资源利用率低、安全性低‘三低’问题的关键技术”,中科驭数创始人、CEO鄢贵海表示,“我们正不遗余力地参与并积极推动算力基础设施的发展,DPU技术开放日既是对DPU技术应用的典型方案展示,也是DPU技术在重要细分场景走向成熟的标志。”

场景一:金融信创需求大爆发,低时延网络DPU实现自主可控

金融信创正在向核心系统深入,对网络时延的要求日益严格,已提升至微秒或纳秒级别。长久以来,低时延网络设备市场被国外厂商如Solarflare和Mellanox所主导,且传统的软件加速方案已达到瓶颈,而中科驭数通过自主研发的低时延网络DPU卡,成功构建了超低时延网络,实现了金融交易核心链路的自主可控和性能优化。

中科驭数的DPU产品已在金融证券行业内实现广泛部署,助力超过30家金融机构完成核心系统的升级替换,确保了金融系统的稳定运行。某头部证券机构通过部署中科驭数的DPU卡,有效解决了交易系统的低时延问题,满足了高频交易对时延的严格要求。

申万宏源联合中科驭数及其他软硬件厂商成立的低时延实验室,对全信创方案进行了权威测试,验证了其在基础设施和业务系统方面的技术性能,测试结果表明全信创环境下的性能提升显著。

随着信创云成为证券机构上云的重要选择,东方证券也与中科驭数合作,引入低时延技术,致力于打造一云多芯、超低时延的信创云平台,实现资源的统一调度和上层应用的广泛兼容,推动信创产业的发展。

此外,银行业也正面临着移动互联网和金融科技创新带来的业务请求和数据处理量的激增,以及业务种类的爆发式增长,这对IT基础设施、特别是云化设施提出了更高的要求。中科驭数的DPU解决方案可以匹配各类高性能网络、存储底座,以及虚拟机、容器与裸金属服务器的共池管理、VPC网络等需求,帮助银行数据中心高效、安全、平稳地过渡到云原生业务架构。

场景二:通用智算中心,DPU支持海量数据交互

随着AI大模型的爆炸式发展,高性能计算从传统的工程科学应用计算逐渐向大数据计算、机器学习和AI运算等新兴数据密集型计算发展。这种趋势不仅对算力提出了新要求,也对异构算力并行计算的数据同步效率提出了要求,更高的数据吞吐、更低的时延和更高效的存储I/O能力,是有效提升算力的基础。

在智算、超算领域,并行文件系统是一种常见且重要的分布式文件存储系统。中科驭数推出的RDMA加速并行文件系统解决方案,采用RDMA网络DPU卡代替传统网卡,将RDMA网络应用与并行文件系统,突破了传统的存算速度瓶颈,解锁了存算之间的高速通道,以更少的计算资源提供更强的网络传输能力。

基于RDMA协议零拷贝、内核旁路的特性,该解决方案大幅降低了并行文件系统在数据读写,数据传输的时延,提高带宽利用率,进而提升并行文件系统整体性能。同时利用DPU卡上的VirtIO-FS技术,将业务侧host的虚拟化功能卸载至DPU,能够减少host端CPU的算力损耗。

场景三:向云原生进发,DPU解决多项行业痛点

随着云计算的普及和深入发展,云原生技术日益出现在各个行业的应用中,成为了IT领域备受瞩目的焦点。云原生技术趋势不仅指明了云计算和应用程序开发的未来方向,更是推动IT发展的重要力量。

不过,云原生技术虽然为企业IT带来了前所未有的灵活性和便捷性,但同时也增加了资源消耗并且影响到业务性能。此外,许多企业的业务系统仍然运行在物理机和虚拟机上,如何实现异构资源的共池调度与管理也是一大挑战。

针对云原生业务的复杂性和高时效性需求,中科驭数的云原生解决方案,采用了以 DPU 为核心的软硬件一体化架构,可以提供统一管理、高度可扩展、高性能、安全的 IaaS、PaaS 层云服务。硬件层支持“一云多芯”和“3U一体”的异构算力架构,可以同时满足通用场景和信创业务需求。自研DPU卡作为该方案的核心,支持网络、存储、安全、管理等负载的卸载,可以充分释放服务器的硬件资源。该方案能够对网络和存储的性能运行加速,提升业务效率,同时实现全域零信任安全方案,降低业务风险。另外,中科驭数还自研了云原生异构管理平台,并基于Kubernetes 的插件机制开发了大量扩展,实现容器、虚拟机、裸金属异构资源的统一调度和运维管理,可大幅提升运维管理效率。

三U一体——未来算力底座的核心

中科驭数高级副总裁张宇回顾了算力底座自2000年以来的发展变迁。从最初以“服务器”为中心的本地部署阶段,到2010年左右进入以“虚拟机”为中心的云计算阶段,再到2020年,行业进入云原生化阶段。这时行业已经基本形成了统一的云原生基础设施,且硬件资源完全池化、“云原生应用”成为了中心。在这个部署阶段,需要统一基础设施管理、对业务系统进行更好的部署、并且需要按需调度集群资源。

“在此背景下,云计算对异构算力需求越来越高。DPU作为围绕I/O核心的算力,对IaaS、PaaS等云服务层起到关键作用,其中,IaaS层包括计算、网络、存储和安全资源,PaaS层则围绕云原生和AI相关优化平台处理加速。随着云计算算力和带宽的提升,以及对安全要求的增加,DPU的应用场景和使用频率不断增长,早已从概念走向实际应用,被国内外顶级云服务商广泛采用”,张宇指出。

特别是在智能计算方面,除了整个云底座的支持外,张宇认为还要关注大模型训练和推理的主流基础设施架构。因为人工智能的发展不仅依赖GPU,还涉及大数据的收集、处理和转化为模型因子全过程中对算力集群的强需求。

这一流程包括模型的训练和部署,服务于各行各业,涉及计算系统的各个方面。而人工智能快速迭代的关键,就在于通用云网络和高性能网络,这些网络支持大量数据交互,需要确保训练时的低时延和大带宽需求,以及推理时的高吞吐量,同时要降低算力成本。

因此从基础设施的角度,需要CPU、GPU、DPU“三U一体”架构的核心支持,对大数据、数据库和大数据集群的处理提供支持。此外,容器化、云原生以及存储技术等,都对算力基础设施提出了更高要求。

“DPU在构建高性能存储、高速网络和分布式文件系统等场景中发挥着核心作用,随着智能计算的快速发展,各大云服务提供商正迅速推进相关技术”,张宇表示,“中科驭数的目标是与国际水平接轨,不仅在时延上达到业界领先水平,还将在带宽和算力成本上寻求超越。”

除了智算领域,DPU在低时延网络、高性能计算、以及边缘计算等场景中的应用正在全面展开。而随着5G的推广,低时延应用场景将得到进一步拓展,这也是DPU落地的关键领域,包括金融、工业互联网等领域。

DPU产业有望迎来飞跃

放眼英特尔、英伟达、AMD等业界巨头,已经形成了完整的 “三U一体”算力平台。而在我国当前产业环境下,独立发展的DPU企业该如何面对竞争,并制定长远的发展策略?

张宇认为,国内的DPU企业需要更具市场适应性。长远来看,国内DPU和CPU企业需要在不同架构体系下与GPU和AI芯片协同发展,甚至可能需要与国际厂商如英伟达GPU等实现兼容。预计未来五年左右,这种多元化的合作模式不会有大的变化。

针对具体应用方向,低时延场景向云端迁移是近两年值得期待的大趋势。张宇透露,中科驭数相关的技术布局已在标杆客户落地,除了金融行业,低时延应用正在向工业、智能交通等领域扩展。除了裸金属级别的部署,云环境中对低时延性能的要求也在增加,中科驭数目前正在与云服务商进行深度适配、兼容性测试和性能调优等工作。

根据2023年《中国数据中心产业发展白皮书》,预计至 2025 年“十四五”规划期末,拟实现数据中心机架规模增长至1400万架,规模总量翻两倍,总增量投资约7000亿元。按服务器规模预计,未来几年云与数据中心领域每年国内服务器出货量将维持在500万台左右,其中DPU渗透率在10%左右,单台服务器可以配置一块到多块DPU板卡,预计每年DPU需求量将在100万片左右。

结合上述需求和趋势,张宇认为,“随着国家对算力投入的增加,以及智能计算对产业的大力驱动,DPU发展前景令人期待,这预示着行业将迎来质的飞跃。”

推荐器件

更多器件
器件型号 数量 器件厂商 器件描述 数据手册 ECAD模型 风险等级 参考价格 更多信息
STM32F103CBT6 1 STMicroelectronics Mainstream Performance line, Arm Cortex-M3 MCU with 128 Kbytes of Flash memory, 72 MHz CPU, motor control, USB and CAN

ECAD模型

下载ECAD模型
$11.49 查看
ATXMEGA256A3U-MH 1 Microchip Technology Inc IC MCU 8BIT 256KB FLASH 64QFN

ECAD模型

下载ECAD模型
$5.86 查看
DSPIC33EP512MU814-I/PL 1 Microchip Technology Inc 16-BIT, FLASH, 60 MHz, MICROCONTROLLER, PQFP144, 20 X 20 MM, 1.40 MM HEIGHT, LEAD FREE, PLASTIC, LQFP-144
$12.18 查看
中科驭数

中科驭数

中科驭数致力于专用处理器研发,为智能计算提供芯片和产品解决方案。围绕DPU芯片打造了智能网卡系列产品和解决方案。

中科驭数致力于专用处理器研发,为智能计算提供芯片和产品解决方案。围绕DPU芯片打造了智能网卡系列产品和解决方案。收起

查看更多

相关推荐

电子产业图谱