本文是清科灵境创始人杨子江教授,在星海图2026具身智能全球开发者大会,“从数据到智能,跃迁的下一程”产业CEO圆桌上的观点分享:
1.数据是具身智能时代的石油
这个类比很形象,但只体现了数据对具身智能的重要性,却忽略了数据的复杂性。
石油的开采、提纯、炼制过程非常复杂,需要经过各种加工才能变成汽油、柴油等产品。同样,具身智能数据的采集和处理,最终形成数据产品也是非常复杂的过程。
真正的挑战不仅是采集数据,更是如何完成数据的采集、筛选、标注和流通。如何获得三维的多模态的数据,高效地提取并加工成有用的数据,这也是需要不断积累的过程。
在能源领域,和石油相关的公司,基本都是跨国大公司,创造能源,源源不断输送向各行各业。在具身智能行业,是否也会形成巨无霸数据石油公司,向具身场景源源不断输送数据?
2.具身智能泛化性受限本质上是缺数据
目前具身智能的训练数据,在质和量上,都还远远不能满足需求。
确切的说,真机数采的数据质量最高,但是成本居高不下。清科灵境独创的硬件设备和数据工具链,可以极大降低真机数采的成本。
同时,仿真数据的成本低廉,但是质量不足,清科灵境依托自动驾驶仿真技术积累,Sim-2-Real上有独特的优势,已经能够训练机器人大脑独立完成长程任务。
3.具身智能需要native的操作系统(中间件)
大家都在拼“大脑”(大模型)和“本体”(硬件),却忽视了另一个致命的结构性缺陷——机器人操作系统(中间件)严重落后。
当前行业标准ROS2存在严重“数据交通堵塞”,就像文件在各部门间反复打印流转。这对于需要毫秒级响应的具身智能场景下,是绝对不能容忍的,成了木桶的最短板。
清科灵境携手华为昇腾,推动具身智能native操作系统DORA在国产算力生态的落地,正在将这个短板逐步补上。
关于清科灵境:
清科灵境从汽车自动驾驶数据合成一路走来,在细分领域做到了行业领头羊。随着二维世界的自动驾驶向三维世界的具身智能时代转变,清科灵境的战略也随之升维,以自身“真实+仿真”数据优势为基础,推出高带宽低延时的机器人native操作系统底座,基于世界模型WAM的机器人本体,已经在科研等垂域场景中开始真实落地。
144