VLA

加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

VLA,vision language action。VLA模型是在 VLM 基础上利用机器人或者汽车运动轨迹数据,进一步训练现有的 VLM,以输出可用于机器人或者汽车控制的文本编码动作。

VLA,vision language action。VLA模型是在 VLM 基础上利用机器人或者汽车运动轨迹数据,进一步训练现有的 VLM,以输出可用于机器人或者汽车控制的文本编码动作。收起

查看更多
  • 刚刚,又一家百亿估值独角兽宣布完成股改
    智平方(深圳)科技股份有限公司已完成股份制改造并更名为智平方(深圳)科技股份有限公司,标志着该公司迈向二级市场的关键一步。作为一家成立于2023年的AGI原生通用智能机器人企业,智平方凭借其端到端VLA技术路线和具身大模型GOVLA,获得了资本市场的高度认可,并迅速实现了商业化突破。公司已进入多个行业场景,且自有产线已具备年产千台能力。截至2026年2月,智平方宣布完成B轮系列融资,规模超10亿元人民币,公司估值突破百亿,成为深圳2026年首个新晋百亿估值具身智能独角兽。
    刚刚,又一家百亿估值独角兽宣布完成股改
  • 独家丨长城汽车智驾自研加速前进,今年上车,预计采用VLA方案
    长城汽车计划今年推出自研智驾方案,并预计采用VLA方案。尽管目前主要依赖于与方案商的合作,但长城一直在寻求自主研发的道路。随着与蔚来、小鹏等新势力厂商在同一时间窗口内实现自研VLA上车,长城的自研实力有望重返第一阵营。此外,长城汽车已经建立了九州超算中心,为大模型产品研发提供算力支持,并在美国硅谷筹备建立自动驾驶研发中心,以吸引顶尖技术人才。
    349
    04/03 10:04
    独家丨长城汽车智驾自研加速前进,今年上车,预计采用VLA方案
  • 英伟达 Alpamayo:基于推理的自动驾驶大模型设计与量产部署全解析
    英伟达在GTC 2026上介绍了其开源的Alpamayo VLA模型,这是一个100亿参数的端到端、基于推理的视觉语言动作模型。Alpamayo通过多阶段训练流程,包括通用推理、轨迹预训练、监督微调和强化学习,提升了模型的推理能力和准确性。此外,Alpamayo还解决了具身不一致和前沿探索等问题。在量产部署方面,英伟达提出了多任务产品功能和模式专家架构,以及生产级别的数据流水线和实时部署技术,确保模型能够在真实车辆环境中高效运行。最新发布的Alpamayo 1.5模型增加了导航和语言对话控制辅助驾驶等功能,进一步提升了其灵活性和可控性。
    642
    03/27 10:00
    英伟达 Alpamayo:基于推理的自动驾驶大模型设计与量产部署全解析
  • 理想MindVLA-o1让自动驾驶更像人?
    理想汽车发布MindVLA-o1,其核心逻辑是通过统一的视觉-语言-动作模型,模拟人类司机的驾驶逻辑,实现从“看见路”、“理解路”到“推演下一秒”的转变。MindVLA-o1不仅提升了三维空间理解和多模态思考能力,还在动作生成上进行了优化,使其更加平稳和可控。此外,MindVLA-o1采用了闭环强化学习和软硬件协同设计,确保模型能够适应实际驾驶场景。
    理想MindVLA-o1让自动驾驶更像人?
  • 理想亮牌:VLA,是物理AI时代的入场券
    理想在GTC大会发布了下一代自动驾驶架构MindVLA-o1,旨在加速物理AI的发展,特别是自动驾驶领域。MindVLA-o1解决了VLA架构的主要问题,如3D空间、语言思考和行为对齐效率不足、长尾场景处理困难和高计算成本。该架构不仅提升了自动驾驶性能,还展示了其在机器人领域的潜力。理想希望通过这一架构推动物理AI的全面进步,最终实现“硅基人”的愿景。
  • 理想汽车下一代基座模型Mind VLA-o1的架构和算法应用解析
    理想汽车在GTC 2026大会上发布了下一代自动驾驶基座模型Mind VLA-o1,强调VLA架构将成为其发展主线。Mind VLA-o1采用原生多模态Transformer设计,解决了感知、语言与动作对齐延迟、计算效率和长尾场景数据扩展等问题。该模型通过闭环强化学习和软硬件协同优化,旨在提高自动驾驶的实时性和智能化水平。
    582
    03/23 10:58
    理想汽车下一代基座模型Mind VLA-o1的架构和算法应用解析
  • 元戎启行的40B VLA自动驾驶基座模型和方法论
    元戎作为中国辅助驾驶/自动驾驶算法供应商的后起之秀,在这两年来量产车辆大幅度上升,拥有长城、吉利、甚至传言拿下了新势力零跑的业务。而且元戎也是比较早喊“VLA”甚至量产"VLA"的供应商。
    1176
    03/23 09:31
    元戎启行的40B VLA自动驾驶基座模型和方法论
  • 小鹏和理想均押注VLA,两者技术各有啥特色?
    随着高级辅助驾驶功能的发展,VLA(视觉-语言-动作)模型成为推动NOA技术的关键。理想汽车的MindVLA-o1采用体系化设计,强调物理一致性和预测式隐世界模型,注重模型结构和工程闭环;小鹏的第二代VLA则更偏产品化,利用连续视频流和分层产品策略,追求驾驶自然和安全。两者各有侧重,理想聚焦于物理模型和模拟器,小鹏则着重于高效算力和模型架构。
    小鹏和理想均押注VLA,两者技术各有啥特色?
  • Mobileye 2026产品战略以及最新VLA算法芯片解读
    Mobileye在2025年表现出色,营收逆势增长15%,达18.94亿美元,调整后营业利润增长45%。其Surround ADAS产品取得突破,预计2026年迎来强劲增长。同时,Mobileye收购Mentee Robotics,正式进军人形机器人领域,推动“物理人工智能”发展。
    893
    03/16 10:04
    Mobileye 2026产品战略以及最新VLA算法芯片解读
  • 小鹏第二代VLA,唯一敢跟特斯拉叫板的中国智驾
    小鹏发布第二代VLA,采用全新物理AI技术,打破传统智驾局限,目标直接瞄准L4级别自动驾驶。该系统覆盖多种场景,性能超越现有L2水平,并获得资本和行业的高度认可。小鹏通过自研技术和大规模数据训练,构建了强大的物理世界大模型,提升了感知精度和决策速度。此外,小鹏计划在未来两年内进一步整合VLM大模型,使汽车成为“超级智能体”,推动自动驾驶进入实用阶段。
  • 越过 L3 直达 L4,小鹏就是中国智驾的 DeepSeek
    小鹏发布第二代VLA,宣告智驾“DeepSeek时刻”。该系统实现了从视觉信号到动作指令的端到端直接生成,大幅提高了智能驾驶的效率和泛化能力。何小鹏提出跳过L3,直接进入L4,并计划在未来一到三年内实现完全自动驾驶。
    越过 L3 直达 L4,小鹏就是中国智驾的 DeepSeek
  • 896线图像级激光雷达!纯视觉VLA疼不?
    华为推出896线双光路图像级激光雷达,大幅提升感知精度与安全性,标志着自动驾驶感知技术进入图像级新时代。
    911
    03/07 11:25
    896线图像级激光雷达!纯视觉VLA疼不?
  • 第二代VLA要与特斯拉FSD v14.2硬碰硬,小鹏汽车刘先明:我大概率不用裸奔了
    作者 | 苏鹏 当智能驾驶进入物理 AI 与世界模型的全新阶段,行业竞争渐渐脱离传感器与算力的浅层内卷。 最终迎来决策架构、泛化能力与落地效率的深层较量。 在上述背景下,小鹏汽车在3月2日正式发布了第二代VLA智能驾驶系统。之所以被定义为 “第二代”,核心在于其对传统 VLA 架构进行了底层重构: 不同于常规 VLA 采用的 “视觉(V)— 语言(L)— 动作(A)” 两层转译模式,小鹏第二代 V
  • 为什么很多车企都青睐VLA模型?
    小鹏发布第二代视觉—语言—动作(VLA)模型,推动自动驾驶从手工规则体系向物理世界大模型的跨越。VLA模型通过统一的神经网络将多模态感知与高层逻辑推理、底层动作执行融为一体,解决了传统自动驾驶架构的信息流失和规则局限问题。相比于模块化设计,VLA模型能够更好地理解和处理复杂的驾驶场景,提升了自动驾驶系统的智能化水平。然而,VLA模型的落地面临算力优化和安全冗余等挑战,需要综合考虑算力储备、仿真效率和数据利用能力。
    为什么很多车企都青睐VLA模型?
  • 何小鹏摊牌:VLA直通终局L4,端到端没机会了
    何小鹏宣布将在一年内实现完全自动驾驶,展示其最新的VLA系统,强调端到端系统的突破,并提出物理AI基座模型的概念。该系统具备强大的感知能力和安全性,通过大规模数据驱动和强化学习不断提升性能。面对竞争对手,何小鹏表示将全力以赴,争取在2026年赢得自动驾驶领域的主导地位。
  • 小鹏第二代VLA产品与技术全景解析
    小鹏发布第二代VLA模型,聚焦用户体验升级与技术突破,展示了物理AI架构的创新与算力优化,强调安全性和大规模仿真能力,目标对标特斯拉FSD,推动舱驾一体化和Robotaxi商业化。
    1581
    03/03 09:27
    小鹏第二代VLA产品与技术全景解析
  • 智驾圈都在等何小鹏
    小鹏智驾在经历了规则时代的巅峰期后,面临其他玩家的快速追赶。为了甩开竞争对手,小鹏选择了拆掉原有的“语言”架构,引入第二代VLA(Vision-Language-Action)系统,实现了更为高效的理解能力和可解释性。刘先明作为小鹏智驾的新任负责人,凭借在美国硅谷的研发经验和对自动驾驶技术的深刻理解,带领团队进行了技术革新。小鹏希望通过不断自我革命,打破组织惯性和技术壁垒,实现智驾领域的领先地位。
    智驾圈都在等何小鹏
  • 高德机器人成果首秀,拿下10个SOTA
    高德发布两个机器人VLA成果,ABot-NO和ABot-MO分别解决了导航和机器人操控任务,均取得SOTA成绩。高德通过统一架构和多模态融合提升了性能,展示了其在具身智能领域的技术实力和战略布局。
    高德机器人成果首秀,拿下10个SOTA
  • 极智嘉发布首款人形通用仓储机器人:技术破壁垒 业绩强兑现 成长有望提速
    全球智能机器人龙头极智嘉(2590. HK)重磅发布业内首款专为仓储场景原生打造的轮式人形机器人 Gino 1,一举攻克仓储作自动化最后一道壁垒,引领行业迈入无人仓新时代。 此前不久,公司披露2025年度录得订单人民币41.37亿元,同比增长31.7%,全球市场份额稳步扩大,叠加正式纳入港股通的资本利好,技术、业绩、资本三重共振,极智嘉迈入全新发展阶段。 市场对此已早有预期。 自上市以来,极智嘉股
  • 已有VLM,自动驾驶为什么还要探索VLA?
    自动驾驶技术正处于发展的转折点。过去十几年间,行业长期依赖模块化的技术路径,即将驾驶任务拆解为感知、预测、规划和控制四个独立环节。这种结构虽然清晰,但在面对突发状况时(长尾场景),会因规则覆盖不足而表现僵化。 随着大语言模型和视觉语言模型(VLM)的爆发,开发者们意识到,如果车辆能像人类一样拥有常识,理解什么是“潮汐车道”,知道“救护车在后方鸣笛需要避让”,那么自动驾驶的上限将得到极大提升。 然而

正在努力加载...