2024年以来,具身智能赛道以前所未有的速度升温。VLA、WAM等具身大模型的涌现,让人形机器人从"能走会跳"的实验室玩具,骤然跃迁为"理解世界、自主行动"的智能体。
资本与产业共振之下,一个共识已经形成:具身智能不是"能不能做"的问题,而是"什么时间、以多快速度规模化落地"的问题。
然而,当整个行业把目光聚焦在模型能力和硬件本体上时,一个沉默的瓶颈正在拖慢所有人的脚步——机器人操作系统(中间件)。
一个被忽视的"数据交通堵塞"
2017年,ROS2(Humble等版本)引入DDS机制,成为现代机器人软件栈的事实标准。对于一个低速、单传感器的巡检机器人来说,这套架构足够了。
但当具身智能进入"多模态感知+实时推理+高频控制"时代,ROS2的"序列化-拷贝-反序列化"CPU通信范式,迅速暴露出其结构性缺陷。
想象这样一个场景:一台人形机器人,同时驱动高清相机、激光雷达、触觉传感器和力矩传感器,每一帧感知数据都必须在毫秒级内传递到推理模块,再转化为控制指令。在ROS2框架下,这些数据流每一次跨进程传输,都要经历"消息序列化→内存拷贝→反序列化"的完整流程——这个过程中,CPU被大量非计算性任务占满,系统延迟剧烈抖动,机器人动作变得迟缓甚至不稳。
更严重的问题出在仿真训练环节。
当前主流的具身智能训练流程中,仿真器与训练进程之间的数据搬运,占用了30%以上的训练时间。以百卡规模的仿真训练为例,GPU算力不是花在模型计算上,而是花在了"把数据从A搬到B"这件毫无增值的事情上。
理论上,这些瓶颈可以借助某些国际大厂的现有技术路线来解决。事实上这些技术路线也确实打造了从硬件直连到通信协议的完整闭环,但问题在于——这是一道"生态围墙"。他们或者高度依赖私有协议与特定硬件,或者受限于物理拓扑,或者仅能在企业级高端卡中被官方支持。
对于正在加速拥抱国产算力的中国机器人产业来说,这些方案——不适用。
换句话说,具身智能产业面临一个尖锐的悖论:机器人本体和算法在快速进化,但连接感知、计算与执行的"数据神经"还停留在上一个时代。而能解决这个问题的国际方案,又被一道"私有协议之墙"挡在了国产算力生态之外。
DORA:重新定义机器人通信的"数据语言"
这个悖论,正是国内具身新势力公司清科灵境瞄准的攻关目标。
早在2022年,清科灵境就联合Futurewei,推出新一代机器人原生操作系统Dora。开源后迅速获得国际AI社区关注,并成功应用于Hugging Face的LeRobot平台,替代原有ROS/ROS2系统。
就在今年,清科灵境主导的“面向昇腾架构的具身智能机器人高性能通信中间件技术”项目,入选“梦想启航·鲲鹏昇腾种子计划”,目标是助力昇腾构建支持仿训一体化的具身智能机器人高性能通信中间件。
目前,基于DORA的具身智能通信中间件,已经完成了与昇腾芯片的适配。
DORA做了一件本质上不同的事:它用Apache Arrow的标准化列式数据描述,替代了传统中间件中"消息序列化-拷贝-反序列化"的整个流程。
Apache Arrow的核心优势在于——数据一旦写入显存,就不再需要"翻译"。不同进程、不同节点可以直接以相同的格式读取同一块数据,这被团队称为"存储即传输"——一份数据,全域可见,零拷贝流动。
打个比方:传统的ROS2通信,像是一个文件在部门之间流转,每次要打印、装订、送到下一个工位,周而复始。而DORA的做法是——直接把文件放在共享工作台上,所有部门随时拿取同一份原件。省去的不仅是复印的时间,更重要的是消灭了"版本不一致"和"传阅延误"的风险。
在这个基础上,DORA进一步构建了三项针对昇腾算力的关键技术突破:
第一,页锁内存驱动的CPU-GPU零拷贝直通。传统方案中,感知节点产生的数据需要先写入CPU内存,再由GPU通过PCIe总线读取,中间经历多次拷贝和上下文切换。DORA将页锁定内存纳入统一生命周期管理,感知数据写入后,昇腾GPU直接通过DMA高速读取。感知节点到推理节点之间的数据通路,被压缩到物理极限。
第二,位置透明的异构GPU无障碍传输。这是最具战略价值的一环。DORA利用Apache Arrow对昇腾GPU显存数据进行标准化抽象,结合Zenoh协议实时感知通信节点的物理位置——同进程、同机跨进程、跨机——自动选择最优传输路径。无论数据源在异构GPU还是昇腾GPU上,下游节点都能以相同的Arrow格式直接消费,无需关心硬件差异。这意味着,国产芯片之间的"方言壁垒"被一套统一的数据语言彻底打破。
第三,轻量级IPC Handle驱动的仿训一体化通信。在仿真训练场景中,DORA构建了统一的IPC Handle管理框架。仿真进程与训练进程不再搬运数据本体,而是传递轻量级的显存引用。同机场景下,两者直接访问同一块GPU内存;跨机场景下,自动切换到Zenoh网络传输路径。这套机制将传统的"搬家式"通信,变成了"电话通知式"通信。
实际测试表明,基于DORA的仿真-训练整体流程中,数据流转效能大幅提升50%。其主要归结于DORA自身的性能优势:相比ROS1/ROS2等主流中间件,DORA的数据延迟仅为前者的7%~10%;在数据采集与录制环节,传输延迟也仅相当于其他中间件的8%,为具身智能的高效研发与快速迭代提供了关键支撑。
这些数字的背后,是一个根本性的范式转换——从"消息驱动的序列化世界",跃进到"数据流驱动的零拷贝世界"。
技术能力不是自封的,是"跑"出来的
一个开源中间件项目,凭什么说自己能承载国产算力落地具身的使命?
答案藏在三层证据之中。
第一层:人的厚度。
清科灵境创始人杨子江教授团队的构成,呈现出一种罕见的"学术深度×工程密度"结构。
杨子江博士是清科灵境公司创始人,发表论文百余篇,拥有二十余项中、美专利。也是中国科学技术大学计算机学院教授、博导,中国科大先研院具身认知科学与空间交互工程技术中心主任,IEEE自动驾驶国际标准工作组副主席,IEEE AI智能体标准工作组(设立中)主席。他于2019年创立清科灵境(由图灵奖获得者姚期智院士孵化),并在2022年于开放原子开源基金会创建了DORA(Dataflow-Oriented Robot Architecture)开源项目。
CTO潘余曦博士,曾任Uber数据科学平台组技术主管及高级数据科学家,在Cisco安全数据组、奇点能源等一线科技公司积累了丰富的工业级系统实战经验。首席科学家张晓东博士,曾任华为工程师,在软件工程与人工智能领域发表高水平论文20余篇。
当大部分人还在争论"学术派做不出工程"或"工程师搞不定创新"的时候,这个团队用DORA项目同时证明了两种能力:底层协议设计上的原创性突破,和面对真实工业场景的工程落地能力。组员超过百人,在AI与软件系统领域的顶会发表论文百余篇——这不是一个"PPT团队",而是一个已经将技术路线跑通了数千个日夜的实战部队。
第二层:产业验证。
清科灵境已入选《互联网周刊》2025中国人工智能500强,获评毕马威中国领先汽车科技50强,荣获沙利文中国AI科创奖,是国家级高新技术企业。公司与华为昇腾、Futurewei、开放原子开源基金会建立了深度协同关系,并长期服务奇瑞、大众、长安、吉利、潍柴、理想等头部车企客户。
这些不是"签约合影"式的浅层合作。清科灵境的DORA框架已经在产业生态中完成了零拷贝通信技术的成功集成——通过自研的共享显存管理组件,在逻辑上实现了同机跨进程场景下的数据传输,从底层协议彻底消除了"显存-内存-显存"的冗余搬运。
第三层:生态站位。
DORA在开放原子开源基金会下运作,坚持"核心能力开源、行业应用增值"策略。这种模式对国产算力生态的战略价值在于——它不只是一家公司的产品,而是整个产业可以共同使用、共同演进的基础设施。
DORA框架一旦被行业行业广泛接纳,后续的硬件迭代、算法更新、应用创新都在这套协议之上生长,这恰恰是昇腾生态最需要的"软件粘性"。
国产算力+自主OS:一个时代的战略交汇
如果把视角拉高一层,清科灵境与昇腾的结合,远不止是一个"加速通信"的技术故事。
全球机器人中间件市场长期被ROS生态主导。ROS本身并不差,但它诞生于学术研究场景,底层设计天然偏向CPU计算模型和序列化通信范式,在GPU密集型计算和异构硬件环境下显得力不从心。
更关键的是,ROS的生态繁荣本质上依附于国外大厂的技术体系——那些称得上"开箱即用"的高性能方案,几乎全部建立在国外大厂私有协议之上。
对于中国机器人产业而言,这意味着一个危险的结构性依赖:你可以在硬件上替换成国产芯片,但一旦要跑高性能训练和实时推理,你立刻就会发现"软件层还没准备好"。
算力自主的前提,是软件基座的自主。
这正是昇腾选择DORA的深层逻辑。
昇腾910/910B系列提供了强大的国产算力硬件,DORA则提供了使这套算力在具身智能场景中真正"跑起来"的软件基座。两者结合,构建了一条从芯片到操作系统到应用框架的完整国产链路。
站在商业视角上,这条链路的想象空间比大多数"国产替代"叙事要大得多。
国产版机器人OS的商业模式——按节点/卡数授权、异构适配交钥匙服务、核心开源+高级特性商业授权,本质上是在做"机器人OS的订阅服务"。当DORA中间件成为国内具身智能领域的行业标准,它就从"工具软件"变成了"产业基础设施"。就像Android没有卖操作系统而是通过生态赚钱一样,DORA的目标也不是卖一行代码,而是成为机器人产业链中那个"绕不开"的底层环节。
清科灵境从汽车自动驾驶数据合成一路走来,储备了深厚的技术Knowhow,在细分领域做到了行业领头羊。随着二维世界的自动驾驶向三维世界的具身智能时代转变,清科灵境的战略也随之升维,以自身数据优势为基础,推出高带宽低延时的机器人操作系统底座和WAM机器人大脑。
清科灵境的具身机器人,已经在AI for Science、医药配送、工业智能等领域储备了多项潜在重大项目,涉及头部车企、科研院所、工业龙头与城市级智慧场景。
加入鲲鹏昇腾种子计划后,48卡昇腾GPU算力将直接加速项目在仿真训练一体化场景中的核心能力突破。
仿训一体化的通信瓶颈一旦打通,国产机器人从"能用昇腾"到"昇腾更好用"的跨越,就不再是一个愿景,而是一个倒计时。
从这个意义上讲,清科灵境杨子江团队与昇腾的合作,不是在做一个"国产版ROS"——他们是在定义国产算力时代的机器人数据语言。
快,是站上具身智能高性能舞台的入场券;通,是在舞台上演出的全部内容。
当通信延迟从毫秒进入亚微秒,当数据格式从"各自为政"走向统一标准,当仿真训练从30%的时间浪费变为接近100%的算力利用率——具身智能规模化落地的最后一块拼图,正在被补上。
步日欣,创道硬科技创始人,北京邮电大学集成电路专委会副会长,浙商证券研究院专家,兼任多家投资机构投委。电子工程本科、计算机硕士学位,具有证券从业资格、基金从业资格,拥有IT研发、咨询、投融资十五年以上经验,关注投资领域为半导体、智能制造、新能源等。“硬科技新势力”平台覆盖5w+投资人和几千家科技型创业企业,并辅导几十家科技企业完成股权融资。
385