从高精地图到无图，智驾企业为什么要这么做？为什么敢这么做？

在自动驾驶发展的早期阶段，高精度地图（High-Definition Map, HD Map）一直被视为实现高阶自动驾驶的标准答案和安全底牌。通过提前录入厘米级的道路信息，车辆得以在受限的算力条件下实现精准的路径规划和定位。但随着智驾系统从封闭高速走向错综复杂的城区道路，传统高精地图的局限性日益凸显，促使行业开始重新审视图在系统中的地位。

所谓的无图方案，并非彻底抛弃所有地图数据，而是去高精地图化，其核心是让自动驾驶系统摆脱对预设静态数据的过度依赖，转而通过车载传感器实时捕捉环境数据，并利用先进的感知算法构建实时的环境模型。

这一过程被形象地描述为从死记硬背向举一反三的进化，车辆不再依赖于一份被框死在厘米精度里、更新缓慢且昂贵的死地图，而是依靠一张能够指引方向、提供宏观预判的活地图来识别道路。特斯拉负责人Ashok Elluswamy在2021年AI Day上就做过一个比喻，高精地图之于自动驾驶，就像一个必须依靠详细剧本才能演戏的演员，一旦剧本出错或场景变化，系统就会陷入混乱。这一观点成为后来行业转向去高精地图化的核心思想渊源之一。

高精度地图的兴起及其技术瓶颈

高精度地图是专为机器设计的数字化模型，其精度可达到厘米级。与传统导航地图仅记录路名和基本路径不同，高精地图记录了包括道路几何形状、车道线类型、红绿灯精确三维坐标、路缘石高度、甚至道路的坡度和横向倾角等极其详细的物理特征。

在单车智能发展的早期，高精地图扮演了三个关键角色。

第一个是作为超视距传感器，它能提供两公里外的立交桥走向或被大型车辆遮挡的红绿灯位置。

还有就是提供稳定的无源定位方式，车辆通过匹配实时感知的特征与地图预存特征，在GPS信号弱的环境下可以获知相对位置。

高精地图通过预存静态信息，更能有效地减轻感知层在实时检测方面的计算压力，使系统能够将更多的算力资源集中于动态物体的识别与跟踪。

虽然高精度地图优势非常明显，但是在大规模应用时却出现了很多问题。

城市道路环境的变化速度远超地图的更新频率。高精地图的制作难度大、成本高，传统图商通常只能实现季度级甚至半年级的更新。而城市道路中的施工、临时改道或交通标志变动，可能在一天之内发生。一旦地图数据与现实环境不符，基于地图指引的系统可能会产生严重的规控逻辑混乱，甚至导致安全事故。

在2025世界智能网联汽车大会上，四维图新CEO程鹏就坦言，地图的轻重取决于应用场景和自动驾驶级别，高精地图没有绝对的理想模式，需要找到商业博弈的平衡点。商汤绝影CEO王晓刚在2025年9月则更直接地提出，智能驾驶正从规则式智驾1.0经端到端智驾2.0，迈入生成式智驾3.阶段，地图的角色正在被重新定义。

高精地图的采集与维护也极其昂贵，传统的高精地图采集车配备了高线数激光雷达、高精度惯导（IMU）和全景相机，单台车的改造成本将达到百万人民币以上。根据《智能网联汽车高精地图白皮书》数据，厘米级地图的测绘成本达到每公里千元，是分米级地图的100倍；按每天每车100公里采集效率计算，单日成本高达10万元，若覆盖全国1000万公里城市道路，总成本将达到百亿元级别，即使头部车企也难以承受。

一张城市级高精地图的制作成本更是高达数亿元，更新周期以月计，覆盖率、时效性都跟不上车企量产节奏。据相关数据显示，2024年中国高精地图市场规模已突破80亿元，预计到2030年将超过300亿元。但传统采集模式下，一辆专业采集车一天仅能完成几十公里的采集任务，且后期需要人工核对校准，周期长、成本高。对于需要覆盖全国数十万公里城市道路的目标而言，这种投入规模对车企和图商都是巨大的财务负担。

对于高精度地图还有一个不得不面对的问题，那就是安全问题，高精度地图涉及国家地理信息安全。近年来，相关监管持续收紧，拥有导航电子地图制作甲级测绘资质的单位数量不断缩减。这种资质壁垒导致许多车企在数据采集、处理和云端下发过程中都需要解决很多问题，这直接限制了自动驾驶方案的推广速度。

2025年7月，北京市规划和自然资源委员会就向某知名图商下发了《限期整改通知》，原因是该公司现有技术人员不再符合测绘资质标准要求。同年，自然资源部进一步强化了对导航电子地图制作测绘资质单位和车企的指导监督，要求地图新增地理信息内容必须进行安全审校并及时备案，严格规定从事相关活动的车企、地图服务商及智能驾驶软件提供商必须持有相应测绘资质或委托有资质单位。这一系列监管收紧动作，直接加速了车企去高精地图化的决策进程。

无图化技术的核心底层逻辑

无图方案的核心在于重感知，即利用更强的硬件和算法取代高精地图的输入。在传统方案中，每个摄像头独立成像并进行2D检测，这导致跨摄像头目标融合极其困难，且无法准确获知物体在3D空间中的位置。

2021年，BEV（Bird's Eye View，鸟瞰图）技术的出现彻底改变了感知架构。BEV通过将不同视角、不同传感器的原始数据投影到统一的俯视图空间，实现了环境信息的全局对齐。

特征提取（Backbone）：利用如YOLOv8等主干网络提取各摄像头的深层语义特征。

特征融合（Neck/BIFPN）：采用BIFPN等特征融合结构，将多尺度的视觉特征进行深度整合。

空间转换（Transformer）：通过Transformer模块进行空间位置查询，利用注意力机制将2D图像坐标系转换为统一的2D鸟瞰图坐标系。

2021年至2023年间，特斯拉在AI Day和CVPR会议上全面公布了基于Transformer的BEV感知、纯视觉占用网络OCC和基于神经辐射场（NeRF）的三维重建技术，这些发布深刻影响了整个行业的技术走向。

占用网络可以将三维空间划分为无数个小方格（Voxels），并检测每个网格的占用状态及其运动速度。

运动状态识别：系统通常用蓝色表示正在运动的物体，用红色表示静止物体。

长尾场景（Edge Cases）处理：对于掉落的纸箱、伸出的树枝、异形施工车辆等传统3D目标检测难以涵盖的物体，占用网络能准确识别其物理占据的空间，确保车辆能够做出正确的避让决策。

物理规律约束：该架构确保了物理世界的几何连续性，例如物体不能瞬间位移，两个实体不能在同一时间占据同一空间。

在国内，小鹏汽车推出的XNet深度视觉神经网络率先将BEV感知大规模量产落地，依靠强大的实时感知能力，XNet能够在不依赖高精地图的情况下识别道路结构、车辆与行人。据统计，截至2025年底，BEV+Transformer架构已被超过80%的主流智驾方案采用。

为了在没有预制地图的情况下理解复杂的路口关系，有些智驾系统还引入了实时拓扑推理技术。RCR（Road Connection Reasoner，道路拓扑推理）网络或MapTR（Map Transformer）技术被用于在行驶过程中实时生成道路连接关系。

这种能力使得车辆在面对磨损的车道线、复杂的环岛或没有导流线的施工区域时，能够像人类驾驶员一样，根据路缘石、车流轨迹和地面箭头推理出正确的行驶路径。

无图并非真的没图

自动驾驶行业内对于无图的宣传存在一定的噱头成分，其实目前并没有一家主流车企能够完全脱离地图运行，只是将对图的依赖从高精地图转向了标准精度地图或轻地图。

在无图方案中，SD地图（导航地图）依然不可或缺。它的主要任务是负责宏观的路径规划，告知系统在哪个路口调头、在哪个出口下高速。如果没有SD地图提供的全局底图，自动驾驶系统虽然可以避开眼前的障碍，但却无法引导车辆到达特定的目的地。

在很多企业的宣传中，还可以听到轻地图（LD Map）的概念，所谓轻地图，可以看作是高精地图的精简降级版。相比高精地图，轻地图舍弃了厘米级的几何细节，但保留了关键的语义信息（如复杂立交桥的拓扑逻辑、限速信息、隧道位置）。

超视距指引：即使车载传感器能看清200米外的环境，但在时速120公里的高速行驶中，反应时间依然有限。轻地图作为一种先验信息，能让系统提前预知前方的隧道或复杂弯道，从而预先调整感知权重和加减速策略。

逻辑兜底：在极端天气（如大暴雨、暴雪）导致感知系统大面积失效时，轻地图提供的静态路径参考可以作为安全兜底，维持智驾系统的连续性，避免突然的接管需求。

值得一提的是，特斯拉FSD入华时也选择了轻地图路线，其采用了百度的轻图产品，百度的轻图介于高精地图和导航地图之间，相比高精地图信息更精简，没有定位层信息。这一选择表明，即便是在去高精地图化最激进的企业那里，一张轻量级的底图依然是不可或缺的。当前，腾讯地图也已异军突起，据《高工智能汽车研究院》数据显示，腾讯已为蔚来、乐道、极氪、魏牌等品牌的城市NOA提供智驾地图服务，占新能源乘用车市场标配城市NOA智驾地图49.01%的市场份额。2024年6月，广汽与腾讯战略合作全面升级，基于腾讯的云计算和轻地图能力，共同推出端云一体的自动驾驶轻地图解决方案。

为了解决地图更新的鲜度问题，有些车企采用了众源更新网络。利用量产车上的摄像头、惯导等传感器实时采集道路的变化，并上传至云端进行脱敏和匿名化处理。这些数据经由云端大模型自动标注后，再下发给车端。

Mobileye的REM（道路经验管理）是业内最早的众源建图实践之一，通过低成本摄像头为核心，利用众包数据构建实时更新的全球地图网络。在国内，小鹏汽车也在预研将众包建图作为智驾方案之一。高德等图商已建立起大规模的众源更新网络，如通过物流车每天数百公里的有效里程，实现对轻地图的天级更新。这种方案将数据生产从专业采集车集中作业转变为每一辆量产车都是地图更新者，大幅降低了更新成本并解决了鲜度问题。

随着感知能力的跨越，自动驾驶算法结构也正在经历从模块化向端到端转换。传统的自动驾驶架构采用感知—预测—规控的串行结构。这种结构的缺陷在于每个模块之间存在明显的信息损耗，且各模块之间的硬编码逻辑规则难以覆盖无穷尽的真实交通场景。感知层输出的一个微小噪声，可能会在规控层被放大为一次危险的急刹。

端到端模型的核心特征是通过神经网络直接建立从摄像头视觉输入到行驶轨迹输出的映射关系。

全局式端到端：思路清晰，研发成本相对较低，无需人工标注数据集，依赖于大规模高质量人类驾驶数据的模仿学习。

驾驶直觉的形成：模型通过学习数亿英里的真实驾驶数据，形成一种类似人类的驾驶直觉，能够理解物理规则和博弈逻辑，而不仅仅是看图说话。

轻舟智航创始人于骞在2026北京车展上指出，自动驾驶规则模块化的小模型时代已经结束，下半场是大模型，或者说物理世界的基座模型。他给出一组关键数据，小模型架构的天花板大概能做到百公里接管一次，而特斯拉FSD V14可以做到千公里级接管，差距达一个数量级。

2025年，理想、小鹏、元戎启行等在两周内先后宣布VLA大模型上车，VLA被业内视为端到端方案的智能增强版，其中V代表视觉感知，A代表动作执行，而中间的L则是大语言模型，其功能是用语言数据训练模型做隐式逻辑推理。

理想汽车在2025年将空间理解、语言理解与行动决策统一到同一模型框架，构建了基于VLA、世界模型与强化学习三大技术栈的VLA司机大模型，并于当年8月随理想i8交付正式推送。2026年3月，小鹏汽车第二代VLA正式推送，何小鹏透露该系统可实现识别各种异形车辆、绕行事故现场、对起伏烂路提前降速、夜间礼让小动物等能力，极端场景接管率较上一代下降62%，Ultra车型用户首周日均智驾开启率高达98.52%。

为了解决端到端模型在应对未见过场景时的泛化难题，世界模型（World Model）也成为了2025年前后的技术热点。

世界模型能根据传感器输入信号和车辆运动状态，生成高度逼真的虚拟驾驶场景。这种能力使得智驾系统可以通过与模拟的真实世界交互，深度理解物理法则。

强化学习（RL）：通过构建世界模型生成大量虚拟训练场景，模型在闭环仿真中不断迭代，明确区分合理操作与危险行为。

MindVLA范式：将视觉、语言和动作（VLA）模型相结合，构建符合物理规律的仿真环境，解决训练偏差问题，显著提升在复杂空间理解和交通博弈中的表现。

卓驭科技首席科学家陈晓智在2025年云栖大会上特别强调，世界模型、VLA、一段式端到端等概念并非互斥的技术路线，而是解决自动驾驶不同层面的问题。2026年4月，卓驭科技推出首个原生多模态基础模型，并宣布与中国一汽达成深度战略合作，标志着智驾大模型方案从新势力向传统车企加速渗透。蔚来也在2026北京车展上发布了面向自动驾驶的世界模型（NWM），强调通过自研平衡技术迭代与成本控制。

最后的话

自动驾驶中的无图并不是真的不需要地图，而是地图在系统中的权力让渡。随着BEV、占用网络和端到端模型等技术的成熟，智驾系统对外部数据的依赖已经从厘米级几何指令转变为米级逻辑导引。

在可预见的未来，智驾系统将形成感知与地图的深度融合，车端负责实时的厘米级动态博弈和几何重建，云端通过轻量化的众源地图提供长效记忆和宏观引导。这一演进将是智能体从对齐模板向理解世界的跨越式进化。当车辆能够凭借自身的驾驶直觉在任意陌生的复杂路口自如穿梭时，地图将真正回归其作为导航工具的本质角色，而全场景、全天候的自动驾驶也将由此成为现实。

从高精地图到无图，智驾企业为什么要这么做？为什么敢这么做？

高精度地图的兴起及其技术瓶颈

无图化技术的核心底层逻辑

无图并非真的没图

最后的话

相关推荐