分析快报 | 基座模型驱动智能驾驶突破小模型天花板

当前智能驾驶已迈入规模化落地关键期，城市NOA快速普及、硬件算力持续升级，但行业普遍采用的小模型路线正遭遇能力瓶颈，泛化不足、迭代低效、高算力不增效等问题日益突出。随着多模态基座模型技术成熟，以大模型重构智驾底层架构成为破局关键，基座模型凭借更强认知能力、全域适配与全自动数据闭环，正推动智能驾驶突破小模型天花板，开启技术跃迁与产业竞争新格局。

1、智能驾驶进入规模化落地阶段

2024年起，国内城市NOA（城市辅助驾驶）落地加快，技术迭代、产品量产、市场渗透同步提速，行业投入力度也持续走高，2025年国内智驾整体投入规模突破1200亿元。车载芯片最高算力达到750TOPS，硬件算力底座持续升级。在智能电动汽车发展高层论坛（2026）-AI+汽车论坛上，元戎启行周光提到，其城市NOA方案交付量近30万台，过去一年累计行驶里程超13亿公里，用户使用时长超4000万小时。

2、以小模型为主导智能驾驶能力已触及天花板

当前，国内量产自动驾驶系统以小模型为主，参数量普遍在1B以下，甚至低至0.1B，芯片算力集中在100-200 TOPS，架构以卷积神经网络为主、仅少量使用Transformer。这类模型如同“熟练工”，仅能执行预设的驾驶动作，却缺乏对复杂场景的深度理解、全局分析、自我评估乃至持续认知进化的能力。伴随城市道路场景复杂度持续提升，小模型智驾的优化难度呈指数级上升，“跷跷板效应”愈发明显，同一套系统，可能早间表现优异，午间却频频失误；在上海游刃有余，换个城市便“水土不服”；软件版本迭代更是顾此失彼，优化了A场景，B场景却又“开倒车”。通过反复修补、局部迭代，但始终只能在“可用”的边缘跳跃式小幅进步，无法实现本质性的体验跃迁，整套技术体系已触及明确的能力边界。

2024年行业全面落地端到端、2025年推进VLA（视觉语言动作模型），但受限于底层小模型底座，即便2025年行业大力布局VLA，整体大模型多模态能力仍未成熟，无法从根源解决泛化、不稳定问题。即使堆砌高算力硬件也无法弥补小模型先天不足，700TOPS高端芯片跑出的实际效果，与100-200TOPS芯片差距微乎其微，高昂的硬件投入，并未转化为真实的用户体验提升，投入与产出严重错配。

3、基座模型提升智驾能力上限，技术路线逐渐清晰

2026年初Gemini、Seedance等新一代多模态模型发布，能力实现跨越式提升，直接惠及自动驾驶与机器人领域。多模态可以预测物理世界行为，与自动驾驶预测交通参与者下一步动作逻辑高度相通。自动驾驶是物理AI场景中唯一能持续提供海量高质量真实道路数据的载体。

智能驾驶基座模型采用模型规模+数据规模同步扩张的Scaling扩展模式，彻底抛弃小模型修补逻辑，重构整套智驾底层架构。同时具备会开车、懂开车、评开车三大能力，所有技术环节信息熵全部沉淀在模型内部，驾驶系统从传统执行系统彻底升级为认知系统。

基座模型并非单一版本，而是一套全域共享底座，针对不同算力芯片、不同产品形态分级适配：100TOPS左右芯片采用极致经济型端到端小模型蒸馏方案；500TOPS级别芯片搭载高可靠智驾方案；千TOPS级别面向Robotaxi无人驾驶场景。大基座模型能力提升后，向下蒸馏轻量化小模型技术简单高效，彻底解决高算力不增效的行业痛点。

同时，基座模型重构全自动数据闭环，摆脱对人工标注的高度依赖，迭代周期从以天、周为单位大幅缩短至数小时，精度、效率全面提升，形成可持续进化的数据飞轮。元戎启行已落地40B参数自动驾驶基座模型，依托30万台存量车辆、超10亿公里行驶数据持续迭代。

当前，特斯拉、Waymo已完成基座模型全栈落地验证，国内头部企业完成无图、端到端、VLA三步前置技术铺垫，为基座模型落地打下了技术和产业基础。未来，头部大模型企业有望纷纷入局，智驾竞争不再只是车企、智驾公司内部竞争，而是大模型企业带来的降维竞争。

撰文 | 贾浩

编辑 | 秦海清

指导专家 | 王贺武

分析快报 | 基座模型驱动智能驾驶突破小模型天花板

1、智能驾驶进入规模化落地阶段

2、以小模型为主导智能驾驶能力已触及天花板

3、基座模型提升智驾能力上限，技术路线逐渐清晰

相关推荐