扫码加入

VLA

加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

VLA,vision language action。VLA模型是在 VLM 基础上利用机器人或者汽车运动轨迹数据,进一步训练现有的 VLM,以输出可用于机器人或者汽车控制的文本编码动作。

VLA,vision language action。VLA模型是在 VLM 基础上利用机器人或者汽车运动轨迹数据,进一步训练现有的 VLM,以输出可用于机器人或者汽车控制的文本编码动作。收起

查看更多
  • 高德机器人成果首秀,拿下10个SOTA
    高德发布两个机器人VLA成果,ABot-NO和ABot-MO分别解决了导航和机器人操控任务,均取得SOTA成绩。高德通过统一架构和多模态融合提升了性能,展示了其在具身智能领域的技术实力和战略布局。
    高德机器人成果首秀,拿下10个SOTA
  • 极智嘉发布首款人形通用仓储机器人:技术破壁垒 业绩强兑现 成长有望提速
    全球智能机器人龙头极智嘉(2590. HK)重磅发布业内首款专为仓储场景原生打造的轮式人形机器人 Gino 1,一举攻克仓储作自动化最后一道壁垒,引领行业迈入无人仓新时代。 此前不久,公司披露2025年度录得订单人民币41.37亿元,同比增长31.7%,全球市场份额稳步扩大,叠加正式纳入港股通的资本利好,技术、业绩、资本三重共振,极智嘉迈入全新发展阶段。 市场对此已早有预期。 自上市以来,极智嘉股
  • 已有VLM,自动驾驶为什么还要探索VLA?
    自动驾驶技术正处于发展的转折点。过去十几年间,行业长期依赖模块化的技术路径,即将驾驶任务拆解为感知、预测、规划和控制四个独立环节。这种结构虽然清晰,但在面对突发状况时(长尾场景),会因规则覆盖不足而表现僵化。 随着大语言模型和视觉语言模型(VLM)的爆发,开发者们意识到,如果车辆能像人类一样拥有常识,理解什么是“潮汐车道”,知道“救护车在后方鸣笛需要避让”,那么自动驾驶的上限将得到极大提升。 然而
  • 人形机器人的“端到端”时刻:Figure Helix 02 架构对自动驾驶 VLA 的启示
    Figure发布Helix 02,展示全自主人形机器人从模糊指令到完成任务的全过程,采用三层神经网络架构实现从像素输入到物理动作输出的控制。S2处理指令与环境理解,S1负责视觉运动策略,S0执行全身控制,共同实现自主操作。此架构与自动驾驶中的VLA类似,有望推动人形机器人商业化。
    人形机器人的“端到端”时刻:Figure Helix 02 架构对自动驾驶 VLA 的启示
  • 轻舟的VLA与世界模型架构解读
    理想汽车推出搭载128 TOPs J6M和激光雷达的AD Pro,支持城区NOA的OTA,并由轻舟智航提供算法技术支持。轻舟展示了其融合VLA与World Model的下一代自动驾驶模型架构,该架构通过端到端的方式整合感知、理解和决策模块,实现了更智能的驾驶体验。
    809
    01/26 11:00
    轻舟的VLA与世界模型架构解读