• 正文
  • 相关推荐
申请入驻 产业图谱

具身智能关键一跃:让AI真正“触碰”物理世界

1小时前
197
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

“具身智能(Embodied Intelligence)”这个多少有点抽象的名词在过去一年里出镜率极高。2025年更位列为中国的十大关键词Top 3。进入2026年,马年的春晚上演了一波智能机器人闹春晚的名场面:从行云流水的武术功夫,到盘核桃、捡玻璃碎片、货架取物等精细化操作,再到生活化的叠衣服、串烤肠,他们全都轻松拿捏,动作灵巧且自然拟人。这进一步推高具身智能的话题热度。

“具身智能”到底是什么?它对于人工智能的发展具有什么意义?

从Atlas到擎天柱(Optimus),再到已在全球出圈的中国机器人公司宇树科技……探索具备通用智能,能够像人类一样执行任务的具身智能机器人成为国内外业界的共同目标。具身智能也被视作迈向通用人工智能的重要驱动力,科技巨头纷纷布局,同时加速推进产业融合。

01、为什么要给AI“装”一个身体?

斯坦福大学教授、“人工智能教母”李飞飞给出了极具穿透力的答案。在她看来,如今的AI虽然已经很强大,但有一个根本性的缺陷——它存在于符号世界里,却并未真正“触碰”过物理世界。

如今,大语言模型可以写诗、敲代码、看病问诊,能在几秒钟内读完人类一生的书,却无法真正拥有人类的“手感”,无法像人眼一样“观看”。它们也许看过无数的关于“猫”的图片,读过无数关于猫的文字描述,却不知道抚摸一只猫的触感,下手的“轻重”。它们往往通过描述来“看”物理世界,这跟人类对于物理世界的观感完全不同。人类的“观看”不仅仅基于单一的信息,我们有着更为全面的认知视角——通过对空间关系的推理、预测、互动和想象,来深度理解我们身处的物理环境,这是人类与生俱来的“空间智能”。这也正是李飞飞所指出的通用人工智能的“核心缺口”。

那么,什么是具身智能?根据中国信息通信研究院的定义,具身智能(Embodied Intelligence)是人工智能(AI)与其他学科交叉融合发展的新范式。通过赋予AI“身体”,使其能够与物理实践产生交互,并在交互中主动探索世界、认识世界、改变世界。至于具体的形态,它可以是人形机器人、四足机器人、无人车、无人机,或是其他仿生形态,甚至只是一个机械手臂。

“具身”是前提,“智能”是核心。在李飞飞看来,“空间智能与世界模型”,是具身智能真正的底座。因为AI需要通过感知、行动、反馈的完整闭环,建立起对三维物理世界的理解与预测能力。换句话说,机器人需要的不仅仅是一套能跑能跳的精密“小脑”,更是一个能理解物理常识、能应对真实混乱的“大脑”。

“具身化”可望成为AI从符号世界到物理世界的关键一跃。而过去几年里“大脑”的进步有目共睹,数字世界的AI算法开始展现出逼近甚至超越人类的思维能力。这也是产业界共同押注具身智能的重要原因。科学家们的期待是,具身智能将在技术的涌现式创新和突破下,在复杂的物理世界进一步延伸和拓展AI的边界,实现真正意义上的“知行合一”。

02、各国的具身智能战略路线

全球主要经济体对具身智能的发展都高度重视,但战略路线各有不同的侧重点。不过,近几年的发展中,我们可以观察到,各国都在不断提升细分领域具身智能技术和应用的关注度。

具体来看,美国紧抓人工智能基础研究,保持具身智能领域的前沿领先地位。2024年4月,美国高校联合发布新版“国家机器人路线图”,旨在重振机器人技术领先地位。

日本正在将机器人纳入社会并使机器人成为其社会基础的关键部分。在人口老龄化的背景下持续聚焦机器人应用以升级制造业生产和替代人类服务。2024年丰田研究所推出软机器人Punyo定位于服务人类日常生活,配备内置传感器结合柔软肢体实现全身协同操作。

韩国出台多项政策推动以机器人和自动驾驶为核心的具身智能技术创新。2023年发布机器人产业发展战略,擘画有关行业中长期发展蓝图,在战略中提出到2030年在各领域推广使用百万台的目标。

中国则在加快推进新型工业化进程中,将具身智能作为新质生产力的典型代表,成为各省布局产业规划的关注重点。2024中关村论坛年会"未来人工智能先锋论坛"上,北京市海淀区发布了《打造全国具身智能创新高地三年行动方案》。

03、艰难蜕变:从“表演”到“工作”商业化和产业链挑战

探索具备通用智能、能够像人类一样执行任务的具身机器人,成为业界共同目标。早在2023年,英伟达创始人黄仁勋表示具身智能是能理解、推理,并与物理世界互动的智能系统,是人工智能的下一个浪潮。2024年起,人形机器人迎来一波集中爆发发,其他形态的本体如协作机械臂,移动操作机器人,仿生灵巧手,无人驾驶出租车等也显现出智能升级趋势。

但全球产业界当前面对着一个共同困境:如何让具身智能机器人完成从“ 表演”的“工作”的艰难蜕变。人们希望,未来具身智能机器人将深入融入人类社会,从工业协作生产到柔性制造,从家务助手到医疗护理,从灾难救援到太空探索。

尽管我们在马年的春晚舞台上看到了诸如银河通用机器人“小盖”的一系列惊艳操作:从精细地盘核桃、捡玻璃碎片、货架取物,到生活化的叠衣服、串烤肠,全都轻松拿捏,动作灵巧且自然拟人。而且与传统机器人表演依赖预编程不同,银河通用此次展示干活技能的实现是端到端自主感知、自主决策、自主执行,而且还特别拟人。但或多或少,仍存在一定的“表演性”。

有英国金融时报中文网的一篇分析文章指出,春晚舞台是典型的低复杂度场景:光照均匀、地面平整、动线固定。但真实的生活和商业场景要复杂千万倍,需要应对的可能是光线从清晨到黄昏的变化,是物品的随机摆放,是突然从墙角滚出来的苹果,或是突然从脚边窜过的猫……对于人类而言稀松平常的“意外”,可能会让一个机器人的系统崩溃。因为目前的机器人“大脑”在处理这种开放世界的不确定性时,能力会急剧下降。“它们能在光滑的舞台上完成一百个连贯的空翻,却未必能在一间杂乱的厨房里,准确地从抽屉里拿出一把勺子。”

其结果就是,商业落地陷入一个尴尬的闭环:能做的(表演)不需要,需要的(通用劳动)做不了。而这是全球行业共同面临的瓶颈。无论东方还是西方,无论走哪条技术路线,都正在经历从“实验室奇迹”到“商业现实”的尴尬。

在美国,Optimus采用“场景定义产品”倒逼技术迭代的路线。依托在自动驾驶、电池管理和大规模制造上的积累,马斯克做Optimus的初衷就是为了能让它在工厂里干活。因而其设计之初就瞄准工厂场景,与产线深度耦合。但Optimus至今仍未走出实验室,距离真正的“进厂打工”尚有距离。马斯克本人预计,2025年将有小批量Optimus投入工厂使用,但也承认“这是一个漫长的过程”。

波士顿动力则选择将机器人的运动控制做到极致,旗下的Atlas一路实现了从后空翻到跑酷的运动能力。但“极致”的背后是商业化落地的尴尬——Atlas的液压驱动系统成本高达数百万美元,且能耗惊人。几经易主后,波士顿动力至今仍在寻找可持续的商业模式

在中国,高盛实地调研九家中国机器人供应链企业后发现,供应商普遍规划年产能10万至100万台,但无一家确认收到大额订单或明确量产时间表。

如何真正从“技术秀”迈向“实干”,需要沉入具体的垂直场景,完成一场价值重构,是接下去要解决的实际问题。当前的产业界仍面临技术能力不足、数据短缺以及工程实现复杂等一系列挑战。

首先,涉及产业链条的完整性和各环节之间的协同效率。根据中国信通院的梳理,具身智能机器人产业链的上游、中游和下游产业分布情况大致如下:

具身智能产业链示意图(数据来源:中国信息通讯研究院)

上游:硬件迭代周期与成本不上软件或算法模型的迭代速度。在具身智能本体技术的关键领域和价值链条中,核心技术壁垒主要围绕三大核心组件展开:减速器、伺服系统以及控制器,在机器人整体成本结构中占比六到七成。三大核心组件行业面临精度、稳定性、计算能力等挑战,影响上层软件的运动控制指令以及对更多精准大规模数据的收集能力。

中游:挑战在于如何开发出高效、可靠的软件系统,以及如何实现软硬件的深度集成。比如,开发能够适应复杂环境和任务的控制算法是一个技术难点,同时需要大数据大模型大算力的加持,且三者互相关联,缺一不可,还需要不断更新,适应新的任务与环境。

下游:跨界融合成为应用新挑战。随着具身智能在家庭服务、教育培训、休闲娱乐、医疗保健、生物制造、物流运输、制造业、低空经济、航空航天等行业的广泛应用,个性化定制将成为机器人生成的新模式,跨界融合突破单一领域的应用将成为新的趋势。这需要垂直场景探索与通用泛化兼顾。

04、2026的分水岭,归于“实干”

如果说2025年是具身智能的元年,各家技术和应用的涌现令人眼花缭乱,2026年或将是技术验证和商业落地的分水岭。

从“炫技”走向“实干”将是接下去的主旋律。在沉入垂直领域深耕应用,让具身智能机器人真正在一线“工作”,成为人类的得力“工友”。

在工业制造领域,具身智能有望从根本上打破人机交互的语义隔离,人类可以自然语言、肢体语言、动作示范等更简便的方式与机器人沟通,机器也能及时有效地理解人类意图,能够不断观察周围环境,自主更新、优化决策和行动,实现智能化柔性适配。值得关注的是,一些企业已经开始探索正确的方向。有的公司选择深耕工业场景,聚焦“拧螺丝”、“插拔线”、“焊接”等单一但高频的工序,在有限场景中积累真实数据。

另外,在自动驾驶领域,具身智能通过融合感知、智能决策和执行,以及高度智能的自主学习适应能力,将提升自动驾驶系统的整体性能。在物流运输领域,可以帮助优化仓储物流产线,实现高效货物运转。此外,家庭服务领域和医疗康养领域也将是具身智能的重要应用场景,解放人类双手,应对老龄化问题,实现拟人化交互服务等等。

从更长远来看,对于具身智能更理想的未来设想是,可以实现“一脑多形”,即让一个智能系统适配各种形态的物理实体,如智能机器人、智能车辆等;实现“一机多用”,即让一个机器设备可以灵活地执行多种任务,适应多样化的场景需求。

该发布文章为独家原创文章,转载请注明来源。对于未经许可的复制和不符合要求的转载我们将保留依法追究法律责任的权利。

贸泽电子

贸泽电子

贸泽电子是原厂授权的全球半导体和电子元器件代理商,专注于从授权制造商快速引进新产品和新技术,为新设计以及制造供应链提供支持。

贸泽电子是原厂授权的全球半导体和电子元器件代理商,专注于从授权制造商快速引进新产品和新技术,为新设计以及制造供应链提供支持。收起

查看更多

相关推荐

登录即可解锁
  • 海量技术文章
  • 设计资源下载
  • 产业链客户资源
  • 写文章/发需求
立即登录

贸泽电子(Mouser Electronics)是全球授权半导体和电子元器件代理商,致力于以高效的方式向电子设计工程师和采购推广新一代产品和新技术,全面支持研发阶段的采购。Mouser.cn一个芯片也可出货,新一代产品信息和技术内容每日更新,可在线搜寻超过 1200 家品牌制造商的 3100 多万种产品,其中680 多万种产品可直接在线订购,产品涵盖的应用领域包括工业、机器人技术、物联网、新能源、汽车电子等。想深入了解贸泽电子,请访问:http://www.mouser.cn