扫码加入

  • 正文
  • 相关推荐
申请入驻 产业图谱

机器人大模型研究:世界模型将成为标配,车企入局加速量产应用

04/03 15:05
208
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

佐思汽研发布《2026年具身智能机器人大模型(含VLA)研究报告》,报告重点研究分析与梳理总结的内容有:

具身智能机器人大模型的基本概念、产业生态图谱、多维度分类(应用范围、能力模态、架构)、行业发展驱动因素、关键技术发展方向、商业化模式;

11家科技巨头在具身智能机器人领域的布局规划、团队建设、核心人才、大模型产品及其应用、具身智能机器人大模型产品详细介绍及其落地情况、具身智能生态链合作伙伴、近期关键动态等,包含阿里集团、NVIDIA英伟达、Google DeepMind、OpenAI微软Microsoft、华为腾讯RoboticsX、百度、字节跳动、科大讯飞、商汤科技;

10家知名机器人企业简介、发展历程与规划、机器人产品及大模型搭载情况、自研大模型详细介绍、大模型生态合作情况、近期关键动态等,包含优必选、宇树科技、智元机器人、乐聚机器人、银河通用、星动纪元、FigureAI、Sanctuary AI、1X Technologies、Neura Robotics;

11家车企在具身智能机器人领域的布局规划、团队建设、核心人才、机器人产品及大模型搭载情况、大模型产品汇总、具身智能机器人大模型产品详细介绍、具身智能生态链合作伙伴、近期关键动态等,包含特斯拉丰田、本田、现代、小米、小鹏、广汽、奇瑞、零跑、比亚迪、东风,另外还汇总了全球其他13家车企在在具身智能机器人领域的布局。

具身智能机器人大模型(简称“机器人大模型”)与传统机器人控制算法相比,能够做到端到端或层级决策,无需精确建模,能够在非结构化、开放环境(家庭、户外、杂乱桌面)作业;与通用大模型相比,具身智能机器人大模型更注重多模态信息融合理解(视觉+激光雷达+触觉+文本等),目标是在物理世界完成闭环动作,输出关节角度、速度、抓取力等运动指令。

具身智能机器人大模型与传统机器人控制算法、通用大模型的区别

来源:《2026年具身智能机器人大模型(含VLA)研究报告》

近年来,具身智能机器人大模型领域呈现如下发展趋势:

一、具身智能玩家纷纷开始应用世界模型

当前,以视觉-语言-动作(VLA)模型为代表的机器人大模型在“感知-决策-执行”闭环上取得了显著进展,让机器人能够理解指令并生成动作。然而,这类模型在应对物理世界的高度多样性和不确定性时仍面临瓶颈,其本质更像是在“模仿”训练数据中的模式,缺乏对动作后果的预见和物理逻辑的理解。

引入世界模型正是为了突破这一局限。世界模型的核心是让机器人获得“想象未来”的能力。它通过多模态数据训练,构建一个对物理环境的内部动态表征,能够根据当前状态和计划执行的动作,预测未来多步的状态变化。这意味着机器人可以从被动的指令跟随者,转变为能进行“脑内推演”的主动决策者。例如,在执行“倒水”任务时,搭载世界模型的机器人不仅能识别杯子和水壶,还能在动作前预测水流轨迹、杯子倾斜角度以及可能发生的溢出,从而规划出更安全、精准的动作序列。

应用世界模型的驱动力主要来自三个方面:

解决数据瓶颈:高质量机器人真机数据采集成本极高、规模有限,成为能力跃升的核心制约。世界模型可以作为强大的“数据生成器”和“仿真引擎”,生成海量、可控、高保真的合成训练场景,大幅降低对昂贵真机数据的依赖;

提升决策与泛化能力:通过预测和推演,世界模型使机器人具备一定的因果推理和物理直觉,能够处理训练中未见过的新场景、新物体,实现“举一反三”;

实现大小脑协同进化:行业共识认为,未来机器人的智能将是“大脑”(高层认知与规划)与“小脑”(底层运动控制)协同进化的结果。世界模型作为高层“大脑”的关键组成部分,与负责执行的VLA等模型形成互补关系,共同构成完整的智能体系。

负责执行的VLA等模型与世界模型的协同流程

来源:《2026年具身智能机器人大模型(含VLA)研究报告》

多家企业已经研发出属于自己的世界模型,例如阿里的WorldVLA、英伟达的WAM、腾讯混元3D世界模型、宇树科技的UnifoLM-WMA-0、智元机器人的GE-1等。其中,宇树科技的UnifoLM-WMA-0于2025年9月前后发布并开源,是一个专为通用机器人学习设计的开源模型,现已经适配旗下人形、四足机器人,拥有决策、仿真两种模式,决策模式可预测未来物理交互(如堆叠稳定性、碰撞风险),修正动作,提升复杂任务鲁棒性,仿真模式可生成高保真合成数据,解决真机训练数据稀缺问题。

智元机器人的世界模型GE-1于2025年8月发布,是面向机器人操控的视频生成式世界模型,以 “视频生成+策略学习+仿真评估” 闭环架构,实现从“看”到“想”再到“动”的端到端推理。GE-1与智元GO-1系列基座模型协同,GO-1侧重通用任务规划与常识知识支撑,GE-1专注时空预测与动作预演,提升精灵G2在复杂场景下的任务成功率与稳定性。

智元机器人GE-1在2025年10月随工业级交互式具身作业机器人精灵G2正式搭载落地,并宣布斩获龙旗科技数亿元订单,已实现“做三明治”“倒茶”“擦桌面”等任务。

二、机器人大模型实现跨平台应用

传统机器人开发模式,每款机器人的软件、算法都需要针对其独特的硬件配置(传感器、执行器、形态)进行专门开发和调优,导致研发成本高昂、周期漫长,且能力无法复用。机器人大模型实现跨平台应用可打破这一弊端,通过构建强大的端到端多模态基础模型,为机器人植入可迁移的通用智能,使其能够跨越不同本体(如人形、四足、机械臂)、不同任务和不同环境的限制,实现能力的快速泛化与部署。

2025年开始,英伟达GR00T系列、Google DeepMind的Gemini Robotics、Microsoft的Rho-alpha、华为 CloudRobo、星动纪元ERA‑42等机器人大模型都是支持跨机器人平台开发、跨场景应用的机器人大模型。

2025年Q3,英伟达发布GR00T N1.6大模型,定位通用人形机器人VLA大模型,通过统一多模态接口+模块化适配层+仿真-实境协同流水线+分层部署架构,实现 “一次训练、多机适配” 的跨平台应用。支持人形双臂/移动机械臂、仓储AGV、医疗辅助机器人、科研机器人等,面对新物体/新场景也无需大量数据即可执行,可灵活适配工业制造、物流仓储、家庭与商用服务、医疗康养、科研与开发等多种应用场景。

英伟达GR00T N1.6大模型可跨平台适配的机器人

来源:《2026年具身智能机器人大模型(含VLA)研究报告》

星动纪元端到端VLA具身大模型ERA‑42,2024年12月发布,开始适配于旗下灵巧手星动XHAND1,2025年中先后跨平台应用于轮式服务机器人星动Q5、双足人形机器人星动L7,无需预编程即可快速适配新任务。

三、越来越多机器人大模型开源

大模型开源并非简单的技术共享,开源模式汇集全球开发者智慧,能快速攻克物理世界中的复杂“长尾问题”。同时,开源打破了传统闭源商业模式,让中小企业能基于开源模型快速开发,将资源聚焦于硬件创新和场景落地,形成了“巨头搭台、百家唱戏”的产业格局。

开源的核心是降低研发门槛、加速技术迭代、构建生态壁垒、推动规模化落地,并形成 “开源—生态—数据—更强模型” 的正向飞轮。

开源具身智能机器人大模型汇总(截止2026-3)

来源:《2026年具身智能机器人大模型(含VLA)研究报告》

小米面向具身智能机器人的VLA大模型Xiaomi-Robotics-0,2026年2月12日正式开源,采用Apache License 2.0(允许商用、修改、分发,无 “传染性”)开源协议,全栈无保留,开源完整代码、预训练权重、技术文档、论文、部署方案等。Xiaomi-Robotics-0复用小米自动驾驶感知/决策技术,实现机器人与汽车技术互通,采用了MoE(混合专家)架构,将“大脑”(视觉语言理解)和“小脑”(动作执行)分离,这种设计改善了传统VLA模型可能存在的推理延迟问题,使其更适用于需要实时响应的消费级机器人产品。

四、车企入局解决具身智能机器人大模型真实数据稀缺难题,并提供实地验证场景

车企大规模入局具身智能与人形机器人赛道,对具身智能大模型(VLA、世界模型等)带来海量工业场景数据、车规级传感器数据和成熟的自动驾驶技术栈,可直接将BEV感知、多模态融合、端到端决策等算法迁移至机器人,训练并提升模型的环境理解、任务规划与运动控制能力。车企工厂产线场景可验证机器人大模型的可靠性、成功率,同时暴露模型缺陷,为日后修正大模型提供高可靠的真机交互数据,有效缓解仿真与现实差距大痛点。

车企可解决机器人大模型真实数据稀缺、实地验证难题

来源:《2026年具身智能机器人大模型(含VLA)研究报告》

另外,车企将车规级安全标准与硬件协同设计引入机器人,让大模型在推理延迟、可靠性和落地效率上大幅优化;汽车与机器人核心供应链(电池、电机、传感器、域控制器等)重合度较高,部分机构测算重合度超50%,规模效应大大降低核心硬件成本,模型部署成本同步下降。

例如,广汽集团为解决数据难题,借用了自动驾驶数据采集的经验,将机器人派到真实场景中采集真实数据,并同时进行核心功能的深度适配与实地验证,形成“用中学、学中用”的闭环数据增长模式。在降本策略上,其机器人优先复用车端零部件(如芯片、激光雷达等),并实现关键部件100%国产化。广汽已明确第四代产品GoMate Mini计划在2027年规模化量产,将安防场景作为其机器人首个商业化落地领域。

「联系方式」手机号同微信号

产业研究部丨符先生 15810027571

赵先生 18702148304

数据服务部丨廖女士 13718845418

战略咨询部丨韩女士 15810133447

推广传播部|张女士 13716037793

杜先生 13910162318

相关推荐