当前智能驾驶已迈入规模化落地关键期,城市NOA快速普及、硬件算力持续升级,但行业普遍采用的小模型路线正遭遇能力瓶颈,泛化不足、迭代低效、高算力不增效等问题日益突出。随着多模态基座模型技术成熟,以大模型重构智驾底层架构成为破局关键,基座模型凭借更强认知能力、全域适配与全自动数据闭环,正推动智能驾驶突破小模型天花板,开启技术跃迁与产业竞争新格局。
1、智能驾驶进入规模化落地阶段
2024年起,国内城市NOA(城市辅助驾驶)落地加快,技术迭代、产品量产、市场渗透同步提速,行业投入力度也持续走高,2025年国内智驾整体投入规模突破1200亿元。车载芯片最高算力达到750TOPS,硬件算力底座持续升级。在智能电动汽车发展高层论坛(2026)-AI+汽车论坛上,元戎启行周光提到,其城市NOA方案交付量近30万台,过去一年累计行驶里程超13亿公里,用户使用时长超4000万小时。
2、以小模型为主导智能驾驶能力已触及天花板
当前,国内量产自动驾驶系统以小模型为主,参数量普遍在1B以下,甚至低至0.1B,芯片算力集中在100-200 TOPS,架构以卷积神经网络为主、仅少量使用Transformer。这类模型如同“熟练工”,仅能执行预设的驾驶动作,却缺乏对复杂场景的深度理解、全局分析、自我评估乃至持续认知进化的能力。伴随城市道路场景复杂度持续提升,小模型智驾的优化难度呈指数级上升,“跷跷板效应”愈发明显,同一套系统,可能早间表现优异,午间却频频失误;在上海游刃有余,换个城市便“水土不服”;软件版本迭代更是顾此失彼,优化了A场景,B场景却又“开倒车”。通过反复修补、局部迭代,但始终只能在“可用”的边缘跳跃式小幅进步,无法实现本质性的体验跃迁,整套技术体系已触及明确的能力边界。
2024年行业全面落地端到端、2025年推进VLA(视觉语言动作模型),但受限于底层小模型底座,即便2025年行业大力布局VLA,整体大模型多模态能力仍未成熟,无法从根源解决泛化、不稳定问题。即使堆砌高算力硬件也无法弥补小模型先天不足,700TOPS高端芯片跑出的实际效果,与100-200TOPS芯片差距微乎其微,高昂的硬件投入,并未转化为真实的用户体验提升,投入与产出严重错配。
3、基座模型提升智驾能力上限,技术路线逐渐清晰
2026年初Gemini、Seedance等新一代多模态模型发布,能力实现跨越式提升,直接惠及自动驾驶与机器人领域。多模态可以预测物理世界行为,与自动驾驶预测交通参与者下一步动作逻辑高度相通。自动驾驶是物理AI场景中唯一能持续提供海量高质量真实道路数据的载体。
智能驾驶基座模型采用模型规模+数据规模同步扩张的Scaling扩展模式,彻底抛弃小模型修补逻辑,重构整套智驾底层架构。同时具备会开车、懂开车、评开车三大能力,所有技术环节信息熵全部沉淀在模型内部,驾驶系统从传统执行系统彻底升级为认知系统。
基座模型并非单一版本,而是一套全域共享底座,针对不同算力芯片、不同产品形态分级适配:100TOPS左右芯片采用极致经济型端到端小模型蒸馏方案;500TOPS级别芯片搭载高可靠智驾方案;千TOPS级别面向Robotaxi无人驾驶场景。大基座模型能力提升后,向下蒸馏轻量化小模型技术简单高效,彻底解决高算力不增效的行业痛点。
同时,基座模型重构全自动数据闭环,摆脱对人工标注的高度依赖,迭代周期从以天、周为单位大幅缩短至数小时,精度、效率全面提升,形成可持续进化的数据飞轮。元戎启行已落地40B参数自动驾驶基座模型,依托30万台存量车辆、超10亿公里行驶数据持续迭代。
当前,特斯拉、Waymo已完成基座模型全栈落地验证,国内头部企业完成无图、端到端、VLA三步前置技术铺垫,为基座模型落地打下了技术和产业基础。未来,头部大模型企业有望纷纷入局,智驾竞争不再只是车企、智驾公司内部竞争,而是大模型企业带来的降维竞争。
撰文 | 贾浩
编辑 | 秦海清
指导专家 | 王贺武
226