从AlphaGo到自动驾驶，小鹏走出了AI的“神之一手”

作者 | 白雪

一个特斯拉铁粉变心，需要多久？

一个半月。

春节前美国特斯拉社区的粉头 Brian White，来中国试了次小鹏智驾测试版。结果等到小鹏第二代 VLA 正式发布时，他又来了。

这次，他的感受又不一样了。

Brian 没想到只过了六周小鹏的变化这么大——广州满大街逆行的电动车给老哥看懵了，一边说自己可不敢在中国开车，一边被小鹏第二代 VLA 的表现震惊。

用老哥的话来说，「我没想到才过了六周，中间你们还放了个春节长假，结果这个版本就变得更舒服、更流畅了。要是小鹏继续用这样的中国速度推进，那离 L4 不远了。」

实际上小鹏智驾系统内部的更新速度，比 Brian 想象中还要更夸张，自 2025 年 11 月到现在的半年里，小鹏第二代 VLA 开发了 468 版模型，平均每天就有 4.1 个版本。

这种速度远超特斯拉「测试版每 5 到 10 天更新一次、公开版一个月以上更新一次」。

这么估算，中国的 AI 团队一个月半月的时间就完成了特斯拉一年左右的工作量。

中国团队之卷，令人咂舌。

很有意思的是，上一个能引起智驾圈这么关注的还是规则切换成端到端的范式变革。当时，不少人借道超车，成为了智驾第一梯队。

而这一次小鹏第二代 VLA 预告了即将到来的下一个范式变革：做好基座模型，将会直达智驾终局 L4。

何小鹏的观点是，基座模型必须继续加大力度，否则上限很低，智驾做到某个点就做不动了。

换句话说，智驾想要有能自主思考的涌现能力，得靠基座模型。

这段时间媒体、车主专门测试第二代 VLA 过程中，专门挑荒地、土路、坑路测试系统上线，结果出现了大量可自主思考的现象。

这验证了全球汽车市场上有 2 家车企，通过基座模型，做好了跃迁 L4 的准备。

01所有人都在等的第二代 VLA，效果如何？

开年之后物理 AI 大乱斗，融资、发布会开得眼花缭乱。

其中小鹏第二代 VLA 大面积测试最受瞩目。

其一，小鹏第四代智驾一号位刘先明操刀，很多人迫不及待想看这位硅谷大将改革技术架构，呈现的效果如何。

其二，这一两年来小鹏身边强敌环伺，第二代 VLA 被小鹏内部看作甩开同行的秘密武器，许多同行也在关注。

已经可以想象到，小鹏内部压强研发之大。

但开放试驾后，何小鹏和刘先明都松了一口气。

很多媒体有了共识：小鹏目前的水平已经在第一梯队之上，很多人称小鹏为 T0。

测试的媒体感慨，以前自家测试完各家智驾之后，车都得 OTA，但这回真遇到小鹏，测试完之后反而是「测评路线需要 OTA」了。

而小鹏这边也是态度开放，充满自信。不仅欢迎任何车主开着任意其他车型，去小鹏门店对比试驾，而且路线任选。

「小鹏真的涌现了。」

这种涌现主要体现在安全、场景、效率三个层面。

第一层是安全，第二代 VLA 把安全提到了上限，在实测中甚至有突破人眼以及人类观察力的物理限制。

在夜间弯路、有视野盲区的情况下，右前方有黑衣人走路。如果按人来开，由于黑夜及盲区场景受限，只能慢行。

但对于新一代系统，立即观察到了黑衣人，发现的同时瞬间避让。这种观察与规划能力，大多数的人类驾驶很难做到。

第二层是场景，到了第二代 VLA，才说得上智驾彻底进入全场景通行。

如果只是土路能开智驾，体验感并不好。那么半年前，头部三家基本都能做到，但用户用不用是另一回事。

除非智驾在极限场景内保证安全，还能好用。

举个例子，大坑、缺井盖这种「负向障碍物」场景，是智驾的绝对难题。

不仅在视觉上具有隐蔽性，而且本身场景数据就极为稀少，这就挑战系统的决策与规划能力。强如特斯拉 FSDV14，在实测视频中也无法避让坑洼路段。

让人意外的是，小鹏已经具备坑洼路段通行、避让大坑的能力，让人眼前一亮。

第三层是效率，这一代智驾已经可以直接感受到系统「涌现」。

涌现的核心是被动变成主动，具备思考能力。

这里面有小鹏智驾涌现从「偶然」走向「必然」。

如果说去年年底，小鹏能够识别交警手势自主通行，还能说是偶然得之。

那么这次小鹏放出的多个案例证明了，自主思考成了第二代 VLA 的常态。

这次大版本更新又出现了系统主动让行特种车的画面：车辆窄路行驶，忽然缓慢向右侧停靠，当主驾还一脸疑惑时，左后方一辆急救车疾驰而过。

逻辑是：传统 VLA 是系统模仿学习大量数据，然后针对某些场景强化局部性能。但是第二代 VLA 是当数据量达到足够大、模型具备物理世界逻辑之后，就进化出思考能力。

小鹏 T0 所言不假。

维度之一，第二代 VLA 推送之后，小鹏在 L2+领先于行业现阶段水平。维度之二，小鹏是目前为数不多具备直升 L4 能力的玩家。

代号为 GX 的小鹏高端豪华 SUV，正在用内部最新版本在小鹏园区测试「L4 级无人驾驶」。

第二代 VLA 之所以具备直升 L4 的潜力，是因为一道公式：L4 能力=模型× 算力 x 数据 x 本体。

这个公式形式看似别无新意，实则内容全面变革。

小鹏从算力、模型、数据、本体的整体思考逻辑，希望能让同一个 AI 落在不同设备上运行。

这也意味着，小鹏彻底推翻了原来的车企做智驾的方式。

以算力为例，以前行业关注的重点主要是车端账面算力，但现在：光看账面不够，还要看有效算力。

类似于公摊和实际使用面积的概念，现在芯片不仅卷算力，也卷「得房率」。

小鹏通过芯片-编译器-模型联合优化，为图灵芯片定制了图灵模型，利用开发自动化编译器来最大化算力利用率，计算利用率从 22.8% 提升至 82.5%，推理时延缩短到了 80ms。

中国智驾的自研程度，就是如此「丧心病狂」。

而且，这也正在变成行业共识。

理想最近发布端侧大模型「软硬协同设计定律」的相关论文，里面也提到了类似的概念：VLA 需要更高认知能力，车规芯片到了「堆算力」的上限，现在优化芯片算力利用率才是核心。

小鹏带头，时间线收束。

接下来，车圈大概率会达成共识，有一场从模型到本体的全面革新浪潮。

02得基座模型者，得天下

L2 级辅助驾驶与 L4 级自动驾驶之间看起来隔着千军万马，但实际上都在用「规则」办事。

L2 这一层面，传统 L2 惯用端到端小模型+兜底规则，导致体验更像缝合怪。

在城区要用大量 Corner Case 训练，园区、停车场又要用通过多模态融合和低速控制算法来实现。

给用户最直观的感受就是，人开、机器开的区别很大，即便智驾能开好 80% 的路，但剩下的 20% 的场景却解决不了。体验是能用，但不好用。

另一边，传统的 L4 玩家也用规则办事，通过卷车辆规模、高精地图以及车辆上更精良的传感器和算力装配，试图达到更好的效果。这样做的结果是，智驾的安全下限和能力上限都很低。

典型如 Waymo 与特斯拉的对比。

3 个月前硅谷市区大停电，红路灯全部瘫痪，没有了基本交通规则后，Waymo 的车只能瘫痪在路中间。与之对比，特斯拉的 Robotaxi 丝毫没有受到影响。

说白了，1000 公里的 MPI 不如能自主思考的 AI 架构。

技术范式改革的真正特征是，L2 到 L4 完全打通，形成体验丝滑的智驾完全态。

而这就要靠综合能力：L4 能力=模型× 算力 x 数据 x 本体。

在这个公式里，任何要素没跟上都会对最终效果产生质的影响。

模型也是个很好的案例。

传统自动驾驶讲究分科治学，类似于每一个模块都有独立训练的专才。感知模块负责认路、预测模块负责猜别人怎么走等等。

迈入端到端时代之后，逻辑就变了。

智驾体验怎么样不是哪个模块做得好不好、规则写的好不好，甚至，也不是模型训练得够不够大，更取决于在打造模型的同时，建立一套发现问题—定义问题—验证问题的逻辑闭环。

此时，世界基座模型成了小鹏撬动技术范式的一个支点。

基座模型的本质就是让 AI 学习物理世界是怎么运转的，经过无数次训练之后，系统可以建立智驾对物理世界的理解，像人类一样做出驾驶决策。

基座模型就相当于智驾的教练。

小鹏重押基座模型的核心原因是，经过基座模型训练出的智驾拥有理解世界的能力，这些能力就像生长出来的一样，它能处理「没学过但能推理」的场景，不仅解决了智驾 20% 的高难度场景，还能解决剩下 1% 的极限场景。

特斯拉和小鹏，都是世界模型的簇拥者。

此前汽车之心就曾在文章《智驾圈都在等何小鹏》中提出，特斯拉和小鹏在车端及云端模型布局上及其相似。

在小鹏 2024 年迈入端到端变革之前，内部就早就有所准备了。

首先是能支持云端训练的底层超算中心。

算力是基座模型的「耗材」，建设超算中心意味着真金白银的投入。据何小鹏透露，去年小鹏算力花费大概几十个亿。

截止去年中旬，小鹏的超算中心算力规模已达 10EFLOPS，属于绝对的头部。

其次，基座模型训练需要数据作为「原材料」，必须喂饱基座模型足够多的数据，智驾系统才能变聪明。

去年 4 月小鹏的基座模型参数规模达到 720 亿，累计吃下了 4000 多万条视频片段，而且都是超过 30 秒的长时序视频。

72B 的模型量在目前汽车行业里是天文数字，同时也属于国内大型开源模型的第一梯队。

虽然这个参数量不是 AI 界的最大规模，但依旧够得到一些头部 AI 企业，比如智谱、阶跃星辰的企业级旗舰模型。

向 AI 企业看齐，除了加大算力和数据投入，也需要讲究技巧，提升云端模型的效率方法。

提升基座模型效率，一直是道难题。

毕竟，训练 VLA 模型不像大语言模型只需要解决计算瓶颈，它同时还要要关注数据加载、通信状态。

因此小鹏采用 CPU、GPU 联合训练来打破这些瓶颈。

比如，增加额外的 CPU 节点来并行处理数据等等，以此提升数据供给能力，确保 GPU 能持续获得数据。

无独有偶，与小鹏世界基座模型相对应，特斯拉自动驾驶副总裁 Ashok Elluswamy 也提到过 FASDV14 采用「世界模拟器」训练。

这种模拟器基于特斯拉海量数据集训练，根据当前状态与下一步动作生成未来状态，从而与车端的端到端基础模型闭环，做真实效果的评估。

为了建造世界模拟器，2019 年特斯拉就启动了超算项目，从断断续续自研 Dojo，再到购入英伟达 6.6 万块 H100、H200 用于训练，都足以验证模型的重要性。

这两个玩家的故事告诉我们真正的代际差，不只在数字指标上，也在于思路转换、真金白银的投入上。

与此同时，所谓「基座模型」的另一个关键词是基座。

之所以称为基座，就是因为基座模型不止是面向自动驾驶，还具备通用性。

此时 L4 公式里的「本体」，就开始与小鹏基座模型协同发挥作用。

有段对话很有意思。

——问：现在大模型决策有两种方法，一种是模型直接给出轨迹，另一种是它给出几种轨迹让系统选，小鹏第二代 VLA 是哪种？

——刘先明答：核心是你做的是自动驾驶还是 AI？小鹏做的是 AI，不是只用来做自动驾驶的专用模型。既然做了这么大的范式转变，就不会带着以前的逻辑、规则来解决问题。

传统车企的思维是，把自动驾驶仅仅当做车，挨着一个个区域去解决。

但从第二代 VLA 身上，小鹏开始把它作为 AI 去解决，因此小鹏的世界基座模型可以跨车、跨国家、跨设备。

小鹏用一套基座模型，同时驱动 L2 辅助驾驶、L4 无人驾驶、人形机器人、飞行汽车。这与特斯拉逻辑一致，Optimus 机器人和 FSD 自动驾驶，也在共享同一个世界模型的计算底座。

马斯克希望未来AI芯片与模型能够应用于商业航天火箭

只不过，特斯拉想造的飞行汽车还没补齐「本体」的最后一块版本。

从这个角度上来说，小鹏甚至先于特斯拉一步，从车企成为了 AI 公司。

03「善战者无赫赫之功」

一种说法正在成为现实：物理世界的 AI 基座模型，从自动驾驶开始。

何小鹏原话是「做好基座模型是做 L4 的必修课。不做，就很可能在这次技术转型中被落下」。

从宏观与微观两个层面理解。

宏观层面是 AI 竞赛。一年以前就有人预测过，中国物理 AI 将会大大领先于美国。

起初，这种判断基于中国的制造业、供应链。

举个例子，大到美国的无人驾驶出租车，小到街头的L4级无人配送车、割草机器人，大多采用的都是来自中国厂商的激光雷达，类似案例不胜枚举。

以前，这种供应链优势集中在物理 AI 的「物理」层面，中国天然在物理本体制造上具备迭代及成本优势。

从小鹏开始之后，能做好基座大模型的车企，逐渐转变为科技公司。

中国企业在物理 AI 的「AI」层面也有了反超趋势。

小鹏将世界基座模型复用在机器人、飞行汽车等业务，最终智能汽车很可能会变成高阶的、可运动、可主动服务的 AI Agent。

这才是小鹏的杀手锏。

另一个微观层面则更为关键，即用户视角。

回归到第二代 VLA 身上，能看到经过底层思路变革后的智驾体验，不再是效率、场景之争，反而重新回到了「安心感」上。

这里有两个背景，一是智驾普及率正在日渐提升。

官方数据，2025 年中国具备组合驾驶辅助功能 (L2 级) 的乘用车新车市场渗透率达 64%。

当智驾成为用户购车决策的关键要素，智驾普及之后，面向男女老少，用户评价智驾好坏的交集，就变成了「能不能让我安心」。

第二代 VLA 的另一个称呼是「让妈妈放心开的智驾」。

小鹏妈妈食堂们的妈妈们

过去行业常常认为只有智驾效率超越人，才能算得上聪明。

其实不然。在 AI 领域有一个公式叫做 PR 曲线（精确率-召回率曲线），这个曲线专门用来评估模型性能，曲线越平稳，就代表模型在更大阈值范围内，性能仍然能维持高水平。

这也注定了，智驾必须要在安心、场景、效率之间做权衡。

但小鹏的团队是想通了的。按刘先明的话来说，只要基础能力上去，就能在不牺牲其他维度的前提下，把安全做到更高水平。

「安心感」三个关键要素之一。

所谓安心感，就是感受不到是智驾在开车。

有句话叫做「善战者无赫赫之功」。

放到这个行业，其实智驾不需要意外得之的奇功神勇。真正善于作战的，讲究反而是一种多大投入、多大收获的必然秩序与朴素精神。

刘先明的比喻饶有趣味。

智驾的体验应该就像白开水一样。平淡得让人感觉不到驾驶，而不是天天珍珠奶茶加水果。

从这个层面来看，第二代 VLA 的核心用户体验就在于「无感」。

这也回应了在智驾普及率激增下，第二代 VLA 大概率将转化为实在的用户购买欲，真正有可能把智驾从极客尝鲜，变成到大众常用、大众放心的日用品。

与此同时，何小鹏还在下一盘更大的棋。

接下来小鹏还会有跨域、跨业务应用的三个重要节点：

——2026 年 8 月份小鹏将会推出跨域融合的新一代智驾&座舱产品；

——1-3 年内，全自动驾驶量产落地；

——3-5 年内，小鹏云端基座大模型会赋能机器人、飞行汽车等业务，汽车都会成为超级智能体。

今年 CES 上黄仁勋断言，物理 AI 的 ChatGPT 时刻已经到来。

小鹏第二代 VLA 身上，明确看到了这件事情的发生。有媒体在测评第二代 VLA 时，导航路线规划错误，把车带到了死胡同，开到路口，系统原地思考了 14 秒。在这 14 秒内，系统观察、博弈、思考——它在确认前方是不是真的无路可走。最终系统自主变更导航路线，主动绕路走出死胡同。而这种决策超过了传统 VLA 遇到死路往往降级、接管的反应。小鹏第二代 VLA，涌现出了类人的实时路径规划能力。这 14 秒的思考，恍惚间让人回到了十年前 AlphaGo 决战李在石的「第 37 手」。双方在第三局陷入苦战，第 37 手，AlphaGo 落子却表现得像一次失误。直到后来 AlphaGo 战胜李在石，所有人才发现那看似不像强手的一步棋，只是 AlphaGo 从终局思维出发，超出人类可推理范围去思考的「引子」。从这个视角来看，第二代 VLA 仅仅是小鹏面向物理 AI 最不起眼的一个开始。

从AlphaGo到自动驾驶，小鹏走出了AI的“神之一手”

01所有人都在等的第二代 VLA，效果如何？

02得基座模型者，得天下

03「善战者无赫赫之功」

相关推荐