小马智行的智驾技术发展到什么程度了？

自动驾驶是不断迭代的，早期自动驾驶依赖工程师发现问题、标注数据、调整模型，一辆无人车在路上的一次犹豫、一次误判，需要工程师事后调取日志、逐帧分析，才能定位问题所在。但当车队规模从几百辆扩展到几千辆甚至上万辆时，这种人工驱动的迭代方式必然会出现效率瓶颈。2026年4月，小马智行发布了PonyWorld世界模型2.0，那它的表现到底如何？小马智行的智驾技术取得了什么发展？

小马智行PonyWorld 2.0训练架构

小马智行PonyWorld 2.0最核心的变化，是让AI具备了自我诊断和定向进化的能力，系统不再需要等着工程师来告诉它哪里有问题，而是自己去找问题、自己生成训练任务、自己组织针对性的强化训练。

这个能力是怎么实现的？这个技术的关键是在车端模型里引入了一个意图语义层。这个模块会对AI的每一次驾驶决策做结构化的回溯与归因分析，如这次减速是因为预判行人要横穿，还是因为感知模块对路边静止车辆的归类出了偏差？系统不仅知道自己做了什么，还能判断问题出在哪个环节，然后把诊断结果直接映射到后续的训练流程中去。

有了诊断结论之后，系统会进入第二步，即定向数据采集。过去采集数据的逻辑是广撒网，能采多少就采多少，采集完成后再从中筛选有用的部分。PonyWorld 2.0的做法刚好反过来，它能根据诊断结果，自动识别世界模型精度不足的具体场景，然后生成精准的数据采集指令。如系统可以自动推送请在下午4:30到5:30之间，于A路口和B路口，重点采集逆光条件下非机动车与行人混行场景的数据这类的任务。这意味着数据获取从先采再看变成了按需采集，大幅减少了对无效数据的存储和计算开销。

采集数据后要做的就是高效训练，世界模型会根据车端模型的薄弱环节，自动在虚拟环境中构建针对性的训练场景，集中算力去攻克那些最难的长尾问题，而不再在已经掌握的场景上浪费计算资源。这背后依托的是一套从2020年起就逐步搭建的强化学习体系。与早期靠模仿人类驾驶数据来训练模型的方式不同，这套体系让AI在世界模型里反复自己跟自己练，通过强化学习来提升在复杂交通环境中与其它交通参与者的交互能力。

支撑这套训练体系运转的还有一个精度飞轮的机制，大规模L4无人车队在实际运营中持续产生高价值的真实世界数据，这些数据用来提升世界模型的精度，世界模型精度提升后又能训练出更强的车端模型，车端模型能力增强后支撑更大规模的车队部署，更大规模部署又产生更多高质量数据，形成一个自我强化的闭环。

而且当AI驾驶能力已经远超人类司机之后，普通人类驾驶数据对模型精度的提升作用已经非常有限，真正有价值的，是L4级全无人车队在实际交通环境中独立运营所产生的、包含AI与其他交通参与者之间独特交互模式的数据。小马智行目前已经积累了千万公里级、覆盖城区、高速、园区、停车场等多元场景的纯无人驾驶数据，这构成了一个靠时间难以复制的结构性优势。

在这个体系里，人类工程师的角色也在发生变化。过去工程师是教练，也就是设计规则、标注数据、判断训练重点。现在，AI自己决定需要什么数据、该练什么场景，人类工程师更多是去执行AI生成的采集任务。研发的节奏不再依赖人工经验判断，而是由AI根据自身进化需求自动驱动。

算力底座的跨代升级，新一代域控制器用了什么方案？

训练体系的进化对车端的计算能力也提出了更高要求，2026年4月25日，小马智行发布了与NVIDIA联合研发的新一代自动驾驶域控制器。这块域控制器可以理解为车上负责运行自动驾驶软件的主计算平台，它的性能直接决定了系统能够跑多复杂的模型、处理多少路传感器数据。

新一代域控制器基于NVIDIA DRIVE Hyperion平台打造，搭载的是集成了NVLink技术的NVIDIA DRIVE AGX Thor芯片。Thor芯片采用了NVIDIA的Blackwell GPU架构，这与上一代使用的Orin芯片相比是一次架构层面的跨代升级。通过NVLink互联技术，两块Thor系统级芯片之间可以实现高速、低时延的通信，在双芯片配置下，这套平台的综合AI算力最高可以达到4000 FP4 TFLOPS。

做一个直观的对比，当前小马智行第七代Robotaxi搭载的域控制器使用的是4颗NVIDIA DRIVE Orin X芯片，单颗Orin的算力约为254 TOPS（INT8精度）。新一代基于Thor的平台在算力指标上实现了数量级的跃升，同时在能效和对最新AI模型的支持能力上也做了全面升级，可以更好地满足L4级自动驾驶在多传感器融合、全场景感知和复杂场景理解方面的计算需求。

在部署灵活性方面，这套平台支持单芯片和多芯片的灵活配置，可以搭配不同等级的散热方案，形成覆盖不同算力等级的产品组合。这使得同一套底层架构既能用在Robotaxi上，也能适配物流车、矿区运输、低速配送等对算力要求不同的场景。

第七代Robotaxi的传感器与安全冗余设计

有了PonyWorld 2.0训练的AI模型和新的计算平台方案，具体落地到一辆能上路运营的无人车上，还需要一整套车端的传感器配置和安全保障机制。小马智行第七代Robotaxi系统目前在极狐阿尔法T5、埃安霸王龙、丰田铂智4X三款车型上完成了部署。

这套系统的传感器方案是全车搭载6大类共34个传感器，其中包括9颗激光雷达、14颗摄像头和4颗毫米波雷达。多种传感器的组合是为了在不同维度上互补，激光雷达提供精确的三维空间信息，摄像头提供丰富的视觉语义信息，毫米波雷达则在雨雾等恶劣天气下保持稳定。这套方案能够实现车身360度无死角覆盖，最远感知距离达到650米，可以应对城市拥堵、路口转弯、行人避让等各种复杂路况。

安全冗余是L4级自动驾驶绕不开的话题，所谓冗余，简单说就是关键部件有备份，主系统万一出故障，备用系统能立刻接替，确保车辆进入安全状态。第七代Robotaxi采用了一套多重系统冗余架构，包含了20余项安全冗余设计和1000多项监控方案，计算平台、感知系统、制动控制、转向控制、通信链路、供电系统等关键环节都设置了冗余备份，整套系统的核心零部件全部采用车规级标准，设计寿命达到10年或60万公里。

从载人到拉货，轻卡与重卡的技术复用与拓展

L4级自动驾驶技术从乘用车拓展到商用车领域，在技术层面要解决的核心问题是如何复用已有的技术积累。小马智行在2026年北京车展上联合宁德时代发布了全球首款全车规、全冗余的L4级无人驾驶轻卡，同时第四代自动驾驶重卡也实现量产下线。

这两款商用车型在技术路线上的共同特点是与Robotaxi共享同一套底层技术栈，无人轻卡和Robotaxi实现了三个层面的技术同源，一是L4级自动驾驶算法栈直接复用，不需要从头开发一套新的算法体系；二是传感器和计算平台的硬件方案共享，Robotaxi上已经验证过的激光雷达、摄像头、毫米波雷达的组合方案以及域控制器可以直接移植；三是整无人化运营运维体系复用，包括自动补能、地勤调度、远程协助等一整套车队运营基础设施都可以直接沿用。轻卡和重卡在投入运营之初，就继承了一套已经在北上广深等一线城市经历过复杂工况、暴雨夜间以及大量实际运营考验的成熟技术。

在安全架构方面，无人轻卡采用了覆盖转向、制动、通信、电源、计算、传感器六大系统的全冗余架构，全部使用车规级零部件，设计寿命达到60万公里或2万小时。该车具备全场景L4级无人驾驶能力，支持全天候不间断运营，最高时速70到100公里每小时，能够应对城中村狭窄道路、晚高峰复杂路况以及暴雨等恶劣天气，覆盖快递分拨、商超补货、餐饮冷链等B2B城配场景。

第四代自动驾驶重卡则基于三一江山纯电平台打造，同样采用全车规、全冗余设计，自动驾驶套件成本较上一代下降了约70%，设计寿命达到2万小时，可支持100万公里货运运营。在运营模式上，小马智行已获得全国首张自动驾驶卡车编队后车无人化载货示范许可，可以在京津高速等线路开展1+N编队的无人化运输，即头车有人驾驶，后车全无人跟随，这种编队模式能够在干线物流场景中显著降低人力成本。

最后的话

回顾小马智行2026年的技术布局，可以看到一条清晰的主线，PonyWorld 2.0改变了模型的迭代方式，让AI从被动优化走向主动进化；新一代域控制器提供了支撑更大规模模型运行的算力基础；第七代Robotaxi系统将技术落地为可运营的产品；轻卡和重卡则把同一套技术栈从载人场景拓展到物流场景。这一系列技术升级所指向的目标，是让L4级自动驾驶从能跑走向能规模化地跑。