▍一个普通人控制百台机器人不是梦
想象这样一个场景:你坐在家里的沙发上,轻松地挥挥手、踢踢腿,而在千里之外的工厂、商场、甚至危险的矿井里,数十台机器人正在精准复刻你的每一个动作。
现在,这个属于未来的神话,正在被一群中国的科学家拉进现实。
近日,西湖大学孵化的西湖机器人公司正式发布了人形机器人"泰坦o1"(Titan o1),这款机器人最大的亮点是搭载了全球首个GAE通用动作预训练大模型,相当于给机器人装上了一个超级"小脑"。
在发布现场,当身着动捕服的工作人员做出转身、深蹲、踢球等动作时,泰坦o1几乎在毫秒级时间内完成了精准复刻。更让人惊讶的是,当工作人员故意制造身体踉跄时,机器人也能瞬间跟上,左腿快速跨出稳住重心,右臂反向摆动找回平衡,整个过程如同人类的本能反应。
这套系统最革命性的地方在于,它彻底改变了机器人的操控方式。过去,让机器人做一套动作需要工程师花费数月编程,现在任何人穿上动捕服或打开电脑后台,想让它做什么动作,它就能立即执行。不需要懂编程,不需要专业培训,真正实现了"零门槛"操控。
更重要的是,这套"身外化身"系统支持一对多远程操控。一个操作员可以同时指挥几十台甚至上百台位于不同地点的机器人执行相同动作。在今年的安徽卫视春节联欢晚会上,西湖机器人团队仅用几天时间就完成了10台机器人的五禽戏群控表演,而在以前,同样的节目需要工程师花几个月编程。
西湖大学机器智能实验室负责人王东林教授透露,这套完全自主研发的系统比国际同类技术领先至少6个月。GAE的推理速度较行业水平提升了25倍,是机器人领域第一个真正实现动作泛化的大模型。
▍机器人不再"手脚分家",这颗通用小脑究竟强在哪里
要理解泰坦o1的突破性意义,得先看看现有人形机器人的痛点在哪里。
当前绝大多数人形机器人,本质上还是在"背课文"。每个动作都需要工程师提前编好程序,"弯腰拿杯子"是一套程序,"抬手拿笔"又是另一套。如果让它做个没编过的动作,比如"边走路边擦桌子",机器人就会立即"卡壳"。
更糟糕的是,传统机器人的手脚系统是分离的,下半身负责走路,上半身负责操作,缺乏统一协调。当人类走路时伸手接东西,这是个不假思索的动作,但机器人来做,很容易顾此失彼,要么踩空,要么拿不住。
反应速度也是个大问题。现有机器人从理解指令到生成动作需要几秒钟的"思考"时间,根本跟不上真实世界的节奏。如果你突然递个苹果给它,等它反应过来,苹果早就掉地上了。
而GAE通用动作预训练大模型的出现,彻底改变了这一局面。
王东林教授用了一个精妙的类比来解释GAE的意义:"ChatGPT让AI实现了语言的泛化,能理解并生成各种语言;Sora实现了视觉的泛化,能生成各种视频画面;而GAE,就是让机器人实现动作的泛化,能模仿和执行各种人类动作。"
这个"通用小脑"的强大之处在于:
首先,它让机器人真正实现了手脚协同。不再是上下半身各管各的,而是像人类一样,所有动作浑然一体。泰坦o1在做广播体操时,扩胸、体转、弯腰等复杂动作都能流畅完成,甚至连动作里的"小韵味"都能原样复刻。
其次,GAE具备强大的泛化能力。机器人不需要为每个动作单独编程,遇到没做过的动作也能轻松应对。这就像人类学会了走路的基本原理后,不管是上楼梯、过马路还是踢球,都能灵活运用。
最关键的是,这套系统具备"跨本体"能力。不同品牌、不同结构、不同尺寸的机器人都能加载这套大模型,就像一套通用的"武功秘籍",任何机器人都能学会。这意味着GAE有可能成为机器人行业的标准化基础设施。
西湖机器人团队能够实现这一突破,离不开多年的技术积累。他们拥有全球领先、国内最大的高质量全身运动数据集,包含了人类各种日常动作和复杂动作的详细数据。正是这些海量数据为泰坦o1的"最强小脑"提供了充足的学习素材。
泰坦o1的具体参数也相当亮眼:身高134厘米,体重34千克,总自由度29-69,膝关节最大扭矩165N.M,单臂末端最大负载3千克。这些参数保证了它在执行各种动作时的稳定性和精准度。
▍机器人"分身术"的商业想象空间有多大
泰坦o1不是实验室里的样机,而是已经正式作为产品问世。
西湖机器人创始人王东林教授表示,研发泰坦o1的初衷是让机器人代替人类去做危险的工作。消防救援、矿区作业、高空维修等高危场景,将是泰坦o1的主要应用领域。一个消防员可以在安全区域穿着动捕服,控制机器人进入火场救援;矿工可以在地面操控机器人下井作业,既提高效率,又保护人身安全。
但泰坦o1的应用场景远不止于此。
在制造业,一个熟练工人可以同时操控多台机器人进行精密装配,解决了技术工人短缺的问题。在物流仓储领域,一个操作员就能指挥整个仓库的机器人军团完成分拣、搬运工作。
在服务业,泰坦o1可以进入商超、酒店、养老院等场景。特别值得一提的是,这项技术为残疾人就业提供了全新可能。王东林提到:"也许未来,一个行动不便的人只要手能操作,坐在家里就可以控制机器人去工作。"
在文娱领域,机器人表演将变得更加灵活多样。不需要为每个节目单独编程,编舞师可以直接通过动作示范来"教"机器人跳舞。今年安徽卫视春晚上的五禽戏表演就是最好的例证。
商业化进展也相当迅速。西湖机器人在2025年底启动商业化后,短时间内就斩获了数千万订单,覆盖物流巡检、社区助老、文娱表演、危险作业、科研教育等多个场景。据透露,2026年GAE身外化身系统的渠道销售任务已接近1亿元。
资本市场对这项技术也表现出了极大兴趣。今年2月,西湖机器人宣布完成了由赛富投资基金领投的亿元级Pre-A轮融资,龙芯创投、莫干山基金等知名机构参投。
从团队背景来看,西湖机器人的实力不容小觑。公司创立于2021年,是西湖大学人工智能和机器人领域第一个优质成果转化落地项目。创始人王东林是西湖大学工学院PI、机器人学习领域专家,本硕毕业于西安交通大学,博士毕业于加拿大卡尔加里大学。联合创始人兼首席科学家张岳教授是国际自然语言处理领域专家,负责大模型前沿技术探索。
泰坦o1的命名也颇有深意:"Titan"源自希腊神话中的巨神泰坦,代表强大的力量;"o1"中的"o"象征omnipotence(全能),"1"则代表开始。这个名字寄托了团队让机器人真正融入人类生活的愿景。
随着GAE通用动作预训练大模型的发布,人形机器人行业可能迎来一个新的分水岭。就像ChatGPT改变了人们对AI的认知,GAE也可能改变机器人与人类的交互方式。当机器人能够真正成为人类的"分身",当一个人可以同时在多个地方"存在",这将深刻改变我们的工作和生活方式。
未来,当你拥有一台泰坦o1,你会用它来做什么?是让它代替你去上班,还是派它去看世界,又或者让它成为你在危险环境中的守护者?
这个答案,可能很快就会揭晓。
(更多人形机器人赛道深度文章,请关注微信公众号“人形大讲堂”)
532