扫码加入

  • 正文
  • 相关推荐
申请入驻 产业图谱

从AlphaGo到自动驾驶,小鹏走出了AI的“神之一手”

13小时前
296
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

作者 | 白雪

一个特斯拉铁粉变心,需要多久?

一个半月。

春节前美国特斯拉社区的粉头 Brian White,来中国试了次小鹏智驾测试版。结果等到小鹏第二代 VLA 正式发布时,他又来了。

这次,他的感受又不一样了。

Brian 没想到只过了六周小鹏的变化这么大——广州满大街逆行的电动车给老哥看懵了,一边说自己可不敢在中国开车,一边被小鹏第二代 VLA 的表现震惊。

用老哥的话来说,「我没想到才过了六周,中间你们还放了个春节长假,结果这个版本就变得更舒服、更流畅了。要是小鹏继续用这样的中国速度推进,那离 L4 不远了。」

实际上小鹏智驾系统内部的更新速度,比 Brian 想象中还要更夸张,自 2025 年 11 月到现在的半年里,小鹏第二代 VLA 开发了 468 版模型,平均每天就有 4.1 个版本。

这种速度远超特斯拉「测试版每 5 到 10 天更新一次、公开版一个月以上更新一次」。

这么估算,中国的 AI 团队一个月半月的时间就完成了特斯拉一年左右的工作量。

中国团队之卷,令人咂舌。

很有意思的是,上一个能引起智驾圈这么关注的还是规则切换成端到端的范式变革。当时,不少人借道超车,成为了智驾第一梯队。

而这一次小鹏第二代 VLA 预告了即将到来的下一个范式变革:做好基座模型,将会直达智驾终局 L4

何小鹏的观点是,基座模型必须继续加大力度,否则上限很低,智驾做到某个点就做不动了。

换句话说,智驾想要有能自主思考的涌现能力,得靠基座模型。

这段时间媒体、车主专门测试第二代 VLA 过程中,专门挑荒地、土路、坑路测试系统上线,结果出现了大量可自主思考的现象。

这验证了全球汽车市场有 2 家车企,通过基座模型,做好了跃迁 L4 的准备。

01所有人都在等的第二代 VLA,效果如何?

开年之后物理 AI 大乱斗,融资、发布会开得眼花缭乱。

其中小鹏第二代 VLA 大面积测试最受瞩目。

其一,小鹏第四代智驾一号位刘先明操刀,很多人迫不及待想看这位硅谷大将改革技术架构,呈现的效果如何。

其二,这一两年来小鹏身边强敌环伺,第二代 VLA 被小鹏内部看作甩开同行的秘密武器,许多同行也在关注。

已经可以想象到,小鹏内部压强研发之大。

但开放试驾后,何小鹏和刘先明都松了一口气。

很多媒体有了共识:小鹏目前的水平已经在第一梯队之上,很多人称小鹏为 T0。

测试的媒体感慨,以前自家测试完各家智驾之后,车都得 OTA,但这回真遇到小鹏,测试完之后反而是「测评路线需要 OTA」了。

而小鹏这边也是态度开放,充满自信。不仅欢迎任何车主开着任意其他车型,去小鹏门店对比试驾,而且路线任选。

「小鹏真的涌现了。」

这种涌现主要体现在安全、场景、效率三个层面。

第一层是安全,第二代 VLA 把安全提到了上限,在实测中甚至有突破人眼以及人类观察力的物理限制。

在夜间弯路、有视野盲区的情况下,右前方有黑衣人走路。如果按人来开,由于黑夜及盲区场景受限,只能慢行。

但对于新一代系统,立即观察到了黑衣人,发现的同时瞬间避让。这种观察与规划能力,大多数的人类驾驶很难做到。

第二层是场景,到了第二代 VLA,才说得上智驾彻底进入全场景通行。

如果只是土路能开智驾,体验感并不好。那么半年前,头部三家基本都能做到,但用户用不用是另一回事。

除非智驾在极限场景内保证安全,还能好用。

举个例子,大坑、缺井盖这种「负向障碍物」场景,是智驾的绝对难题。

不仅在视觉上具有隐蔽性,而且本身场景数据就极为稀少,这就挑战系统的决策与规划能力。强如特斯拉 FSDV14,在实测视频中也无法避让坑洼路段。

让人意外的是,小鹏已经具备坑洼路段通行、避让大坑的能力,让人眼前一亮。

第三层是效率,这一代智驾已经可以直接感受到系统「涌现」。

涌现的核心是被动变成主动,具备思考能力。

这里面有小鹏智驾涌现从「偶然」走向「必然」。

如果说去年年底,小鹏能够识别交警手势自主通行,还能说是偶然得之。

那么这次小鹏放出的多个案例证明了,自主思考成了第二代 VLA 的常态。

这次大版本更新又出现了系统主动让行特种车的画面:车辆窄路行驶,忽然缓慢向右侧停靠,当主驾还一脸疑惑时,左后方一辆急救车疾驰而过。

逻辑是:传统 VLA 是系统模仿学习大量数据,然后针对某些场景强化局部性能。但是第二代 VLA 是当数据量达到足够大、模型具备物理世界逻辑之后,就进化出思考能力。

小鹏 T0 所言不假。

维度之一,第二代 VLA 推送之后,小鹏在 L2+领先于行业现阶段水平。维度之二,小鹏是目前为数不多具备直升 L4 能力的玩家。

代号为 GX 的小鹏高端豪华 SUV,正在用内部最新版本在小鹏园区测试「L4 级无人驾驶」。

第二代 VLA 之所以具备直升 L4 的潜力,是因为一道公式:L4 能力=模型× 算力 x 数据 x 本体。

这个公式形式看似别无新意,实则内容全面变革。

小鹏从算力、模型、数据、本体的整体思考逻辑,希望能让同一个 AI 落在不同设备上运行。

这也意味着,小鹏彻底推翻了原来的车企做智驾的方式。

以算力为例,以前行业关注的重点主要是车端账面算力,但现在:光看账面不够,还要看有效算力。

类似于公摊和实际使用面积的概念,现在芯片不仅卷算力,也卷「得房率」。

小鹏通过芯片-编译器-模型联合优化,为图灵芯片定制了图灵模型,利用开发自动化编译器来最大化算力利用率,计算利用率从 22.8% 提升至 82.5%,推理时延缩短到了 80ms。

中国智驾的自研程度,就是如此丧心病狂」

而且,这也正在变成行业共识。

理想最近发布端侧大模型「软硬协同设计定律」的相关论文,里面也提到了类似的概念:VLA 需要更高认知能力,车规芯片到了「堆算力」的上限,现在优化芯片算力利用率才是核心。

小鹏带头,时间线收束。

接下来,车圈大概率会达成共识,有一场从模型到本体的全面革新浪潮。

02得基座模型者,得天下

L2 级辅助驾驶与 L4 级自动驾驶之间看起来隔着千军万马,但实际上都在用「规则」办事。

L2 这一层面,传统 L2 惯用端到端小模型+兜底规则,导致体验更像缝合怪。

在城区要用大量 Corner Case 训练,园区、停车场又要用通过多模态融合和低速控制算法来实现。

给用户最直观的感受就是,人开、机器开的区别很大,即便智驾能开好 80% 的路,但剩下的 20% 的场景却解决不了。体验是能用,但不好用。

另一边,传统的 L4 玩家也用规则办事,通过卷车辆规模、高精地图以及车辆上更精良的传感器和算力装配,试图达到更好的效果。这样做的结果是,智驾的安全下限和能力上限都很低。

典型如 Waymo 与特斯拉的对比。

3 个月前硅谷市区大停电,红路灯全部瘫痪,没有了基本交通规则后,Waymo 的车只能瘫痪在路中间。与之对比,特斯拉的 Robotaxi 丝毫没有受到影响。

说白了,1000 公里的 MPI 不如能自主思考的 AI 架构。

技术范式改革的真正特征是,L2 到 L4 完全打通,形成体验丝滑的智驾完全态。

而这就要靠综合能力:L4 能力=模型× 算力 x 数据 x 本体。

在这个公式里,任何要素没跟上都会对最终效果产生质的影响。

模型也是个很好的案例。

传统自动驾驶讲究分科治学,类似于每一个模块都有独立训练的专才。感知模块负责认路、预测模块负责猜别人怎么走等等。

迈入端到端时代之后,逻辑就变了。

智驾体验怎么样不是哪个模块做得好不好、规则写的好不好,甚至,也不是模型训练得够不够大,更取决于在打造模型的同时,建立一套发现问题—定义问题—验证问题的逻辑闭环。

此时,世界基座模型成了小鹏撬动技术范式的一个支点。

基座模型的本质就是让 AI 学习物理世界是怎么运转的,经过无数次训练之后,系统可以建立智驾对物理世界的理解,像人类一样做出驾驶决策。

基座模型就相当于智驾的教练。

小鹏重押基座模型的核心原因是,经过基座模型训练出的智驾拥有理解世界的能力,这些能力就像生长出来的一样,它能处理「没学过但能推理」的场景,不仅解决了智驾 20% 的高难度场景,还能解决剩下 1% 的极限场景。

特斯拉和小鹏,都是世界模型的簇拥者。

此前汽车之心就曾在文章《智驾圈都在等何小鹏》中提出,特斯拉和小鹏在车端及云端模型布局上及其相似。

在小鹏 2024 年迈入端到端变革之前,内部就早就有所准备了。

首先是能支持云端训练的底层超算中心。

算力是基座模型的「耗材」,建设超算中心意味着真金白银的投入。据何小鹏透露,去年小鹏算力花费大概几十个亿。

截止去年中旬,小鹏的超算中心算力规模已达 10EFLOPS,属于绝对的头部。

其次,基座模型训练需要数据作为「原材料」,必须喂饱基座模型足够多的数据,智驾系统才能变聪明。

去年 4 月小鹏的基座模型参数规模达到 720 亿,累计吃下了 4000 多万条视频片段,而且都是超过 30 秒的长时序视频。

72B 的模型量在目前汽车行业里是天文数字,同时也属于国内大型开源模型的第一梯队。

虽然这个参数量不是 AI 界的最大规模,但依旧够得到一些头部 AI 企业,比如智谱、阶跃星辰的企业级旗舰模型。

向 AI 企业看齐,除了加大算力和数据投入,也需要讲究技巧,提升云端模型的效率方法。

提升基座模型效率,一直是道难题。

毕竟,训练 VLA 模型不像大语言模型只需要解决计算瓶颈,它同时还要要关注数据加载、通信状态。

因此小鹏采用 CPU、GPU 联合训练来打破这些瓶颈。

比如,增加额外的 CPU 节点来并行处理数据等等,以此提升数据供给能力,确保 GPU 能持续获得数据。

无独有偶,与小鹏世界基座模型相对应,特斯拉自动驾驶副总裁 Ashok Elluswamy 也提到过 FASDV14 采用「世界模拟器」训练。

这种模拟器基于特斯拉海量数据集训练,根据当前状态与下一步动作生成未来状态,从而与车端的端到端基础模型闭环,做真实效果的评估。

为了建造世界模拟器,2019 年特斯拉就启动了超算项目,从断断续续自研 Dojo,再到购入英伟达 6.6 万块 H100、H200 用于训练,都足以验证模型的重要性。

这两个玩家的故事告诉我们真正的代际差,不只在数字指标上,也在于思路转换、真金白银的投入上。

与此同时,所谓「基座模型」的另一个关键词是基座。

之所以称为基座,就是因为基座模型不止是面向自动驾驶,还具备通用性。

此时 L4 公式里的「本体」,就开始与小鹏基座模型协同发挥作用。

有段对话很有意思。

——问:现在大模型决策有两种方法,一种是模型直接给出轨迹,另一种是它给出几种轨迹让系统选,小鹏第二代 VLA 是哪种?

——刘先明答:核心是你做的是自动驾驶还是 AI?小鹏做的是 AI,不是只用来做自动驾驶的专用模型。既然做了这么大的范式转变,就不会带着以前的逻辑、规则来解决问题。

传统车企的思维是,把自动驾驶仅仅当做车,挨着一个个区域去解决。

但从第二代 VLA 身上,小鹏开始把它作为 AI 去解决,因此小鹏的世界基座模型可以跨车、跨国家、跨设备。

小鹏用一套基座模型,同时驱动 L2 辅助驾驶、L4 无人驾驶、人形机器人、飞行汽车。这与特斯拉逻辑一致,Optimus 机器人和 FSD 自动驾驶,也在共享同一个世界模型的计算底座。

马斯克希望未来AI芯片与模型能够应用于商业航天火箭

只不过,特斯拉想造的飞行汽车还没补齐「本体」的最后一块版本。

从这个角度上来说,小鹏甚至先于特斯拉一步,从车企成为了 AI 公司。

03「善战者无赫赫之功」

一种说法正在成为现实:物理世界的 AI 基座模型,从自动驾驶开始。

何小鹏原话是「做好基座模型是做 L4 的必修课。不做,就很可能在这次技术转型中被落下」。

从宏观与微观两个层面理解。

宏观层面是 AI 竞赛。一年以前就有人预测过,中国物理 AI 将会大大领先于美国。

起初,这种判断基于中国的制造业、供应链。

举个例子,大到美国的无人驾驶出租车,小到街头的L4级无人配送车、割草机器人,大多采用的都是来自中国厂商的激光雷达,类似案例不胜枚举。

以前,这种供应链优势集中在物理 AI 的「物理」层面,中国天然在物理本体制造上具备迭代及成本优势。

从小鹏开始之后,能做好基座大模型的车企,逐渐转变为科技公司。

中国企业在物理 AI 的「AI」层面也有了反超趋势。

小鹏将世界基座模型复用在机器人、飞行汽车等业务,最终智能汽车很可能会变成高阶的、可运动、可主动服务的 AI Agent。

这才是小鹏的杀手锏。

另一个微观层面则更为关键,即用户视角。

回归到第二代 VLA 身上,能看到经过底层思路变革后的智驾体验,不再是效率、场景之争,反而重新回到了「安心感」上。

这里有两个背景,一是智驾普及率正在日渐提升。

官方数据,2025 年中国具备组合驾驶辅助功能 (L2 级) 的乘用车新车市场渗透率达 64%。

当智驾成为用户购车决策的关键要素,智驾普及之后,面向男女老少,用户评价智驾好坏的交集,就变成了「能不能让我安心」。

第二代 VLA 的另一个称呼是「让妈妈放心开的智驾」。

小鹏妈妈食堂们的妈妈们

过去行业常常认为只有智驾效率超越人,才能算得上聪明。

其实不然。在 AI 领域有一个公式叫做 PR 曲线(精确率-召回率曲线),这个曲线专门用来评估模型性能,曲线越平稳,就代表模型在更大阈值范围内,性能仍然能维持高水平。

这也注定了,智驾必须要在安心、场景、效率之间做权衡。

但小鹏的团队是想通了的。按刘先明的话来说,只要基础能力上去,就能在不牺牲其他维度的前提下,把安全做到更高水平。

「安心感」三个关键要素之一。

所谓安心感,就是感受不到是智驾在开车。

有句话叫做「善战者无赫赫之功」。

放到这个行业,其实智驾不需要意外得之的奇功神勇。真正善于作战的,讲究反而是一种多大投入、多大收获的必然秩序与朴素精神

刘先明的比喻饶有趣味。

智驾的体验应该就像白开水一样。平淡得让人感觉不到驾驶,而不是天天珍珠奶茶加水果。

从这个层面来看,第二代 VLA 的核心用户体验就在于「无感」。

这也回应了在智驾普及率激增下,第二代 VLA 大概率将转化为实在的用户购买欲,真正有可能把智驾从极客尝鲜,变成到大众常用、大众放心的日用品。

与此同时,何小鹏还在下一盘更大的棋。

接下来小鹏还会有跨域、跨业务应用的三个重要节点:

——2026 年 8 月份小鹏将会推出跨域融合的新一代智驾&座舱产品;

——1-3 年内,全自动驾驶量产落地;

——3-5 年内,小鹏云端基座大模型会赋能机器人、飞行汽车等业务,汽车都会成为超级智能体。

今年 CES 上黄仁勋断言,物理 AI 的 ChatGPT 时刻已经到来。

小鹏第二代 VLA 身上,明确看到了这件事情的发生。有媒体在测评第二代 VLA 时,导航路线规划错误,把车带到了死胡同,开到路口,系统原地思考了 14 秒。在这 14 秒内,系统观察、博弈、思考——它在确认前方是不是真的无路可走。最终系统自主变更导航路线,主动绕路走出死胡同。而这种决策超过了传统 VLA 遇到死路往往降级、接管的反应。小鹏第二代 VLA,涌现出了类人的实时路径规划能力。这 14 秒的思考,恍惚间让人回到了十年前 AlphaGo 决战李在石的「第 37 手」。双方在第三局陷入苦战,第 37 手,AlphaGo 落子却表现得像一次失误。直到后来 AlphaGo 战胜李在石,所有人才发现那看似不像强手的一步棋,只是 AlphaGo 从终局思维出发,超出人类可推理范围去思考的「引子」。从这个视角来看,第二代 VLA 仅仅是小鹏面向物理 AI 最不起眼的一个开始。

小鹏汽车

小鹏汽车

小鹏汽车成立于2014年,是一家专注未来出行的科技公司。我们一直坚持饱和式研发投入,构建全栈自研的核心能力,今天小鹏汽车已经成为中国领先的智能电动汽车公司之一。小鹏汽车的使命是,用科技为人类创造更便捷愉悦的出行生活。也是自动驾驶及机器人技术研发商,产品包括飞行汽车、家庭机器人。

小鹏汽车成立于2014年,是一家专注未来出行的科技公司。我们一直坚持饱和式研发投入,构建全栈自研的核心能力,今天小鹏汽车已经成为中国领先的智能电动汽车公司之一。小鹏汽车的使命是,用科技为人类创造更便捷愉悦的出行生活。也是自动驾驶及机器人技术研发商,产品包括飞行汽车、家庭机器人。收起

查看更多

相关推荐

登录即可解锁
  • 海量技术文章
  • 设计资源下载
  • 产业链客户资源
  • 写文章/发需求
立即登录