贾浩楠 发自 副驾寺
智能车参考 | 公众号 AI4Auto
“Robotaxi第一股”、出海落地No.1——文远知行,这是外界最熟悉的标签。
但在内部,文远给自己的定位一直是通用自动驾驶玩家。
证据是什么?
有,且新鲜出炉:
文远知行刚刚发布一段式端到端ADAS解决方案,年内量产上车。
去年智能车参考介绍过Tier 1巨头博世在文远核心算法能力加持下,终于拿出高阶智能辅助驾驶方案。
这次的模式也完全相同,博世联合文远,一夜间掌握、量产端到端最先进技术范式。
文远一段式端到端,体验如何?
文远一段式端到端有了新的名称:WePilot AiDrive。
重点在这个“AI”上,也是“一段式端到端”的核心含义:从传感器数据输入端,到行车轨迹输出端,一个大模型搞定。
在广州城区道路的实测,文远有意提升了很大的难度。
第一个场景是城中村,叠加的Debuff包括行人、电动车、临时修路,城中村穿行,考验更多的是规控能力。下面这个场景,重点在感知能力上:
同样是在夜间,对象大逆光的环境下,WePilot AiDrive成功识别了横穿马路的行人,及时避让,“拟人”还体现在连续顺滑变道的情况下,变道路线规划十分平顺。
这个变道场景其实不难,毕竟整个过程没有后向、侧向车辆逼近,系统没有参与博弈。
“老司机”的博弈能力,更多体现在这个无保护转弯场景,整个过程不疾不徐,既没有因为避让路口电动车急刹,也没有“瞅准一个机会”猛打方向抢行,全程保持合理跟车距离。
整体行车效率和安全性,系统也有兼顾:
光照条件不理想的隧道里,保持安全跟车距离的同时,还能快速超越慢车。
直观体验上,端到端一直就是老司机,但文远的新系统显然更加“老司机”了:
以前是“先看到再思考”,而现在是看见那一刻就已经在动方向盘,路径更短,反应更快,容错率也更高。
和去年量产的系统,不同在哪里
“一段式”是相对之前的端到端模型范式而言的。
端到端的含义是用AI模型替代人工定义规则,直接学习人类成熟驾驶行为,体感上更舒适,也能应对各种各样的corner case。
输入端是传感器数据,输出端是自车行驶轨迹。
但之前的系统,感知一个模型、规控一个模型,再辅以一定的规则兜底。
这是大部分玩家量产端到端最简单、成本最低、最可控的方式——相当于再用保底线的“AEB”思维做智能辅助驾驶。
但带着规则时代的基因,意味着还是解决不了规则时代的核心痛点。
首先是两段式模型间信息传递时,免不了会有数据的变形、损失。
其次,规控模型本身规模不大,很难产生对环境场景的理解能力,更多还是条件反射式地模仿人类开车行为,所以这也是为何有观点认为规控其实根本没必要模型化。
但“规则”就像是端到端开发中令人“上瘾”的止痛药。一开始上少量规则,需要大量数据训练迭代的问题有可能迅速解决……但规则越上越多,最终会发现又搞出一个泛化性极低、驾驶逻辑“前倨后恭”、乘坐体感“前俯后仰”的系统出来。
文远迅速迭代一段式端到端体系,其实是贯彻端到端技术范式的“第一性”原理:
让模型直接学习输入数据与输出轨迹之间的映射关系。
系统性能的迭代提升,主要利用强化学习手段进行训练,而针对性的场景数据,可以来自文远去年已经量产搭载的奇瑞星纪元车型,也可以来自文远的Robotaxi车队,还可以是世界模型。
毕竟文远早就构建起通用AI司机,在感知识别、决策规划等等环节复用算法,无论L2L4、无论乘用货运,基础模型使用相同的数据来训练迭代,后续的仿真测试等等环节,也可以用统一的工具。
所以一段式端到端,是文远探索更进一步的规则+模型的多元技术体系,自证L2+的泛化性、L4的安全性可以共存的落地第一步。
如果文远知行能统一融合L4、L2架构,Robotaxi“地理围栏”范围就有希望逐渐扩大到普通乘用车一样的程度,到这一步实际上地理围栏就已经不存在了,升维降维之争也会彻底终结。
更进一步,通用AI司机的基座大模型,启发的也许不只是自动驾驶…
落地层面,一段式端到端本质其实是“VLA”中的“V”和“A”。
成本上看,VLA中体量最大、占用计算资源最多的是L,意味着车端必须要上千TOPS 级别的计算硬件,难以普及到30万以下的车型。
技术上看,大语言模型在车端有限算力上,很难把延迟做低。
有多难呢?举个例子,6月份英伟达发布了Thor平台的延迟测试报告,用的是内部自研大模型,而且是参数量仅2B的VLM,一通优化后在1000T的ThorX平台上跑出了530ms延迟,不到2Hz,远低于自动驾驶底线要求10Hz左右。
系统延迟降不下来,意味着VLA用在实时性要求极高的智能辅助驾驶系统,对技术实力、成本投入要求极高,更多的车企可能最多做一做“语音控车”这样非刚需功能。
但对于文远和合作伙伴博世来说,最后交付量产的方案,必须是全行业的方案,而不是给某个车企某个车型独供。
眼下,中国市场标配高阶智能辅助驾驶的车型,算全价位全品类,占比还不到20%。
所以文远+博世的一段式端到端,目标不是追赶行业一股脑押注的单点技术突破,而是真正把高阶能力普及到各个价位车型,用L4同源技术尽快推动L2+越过“价值拐点**。
好消息是,这项任务中最大的挑战,已经不在文远“技术”本身了。
【智能车参考】原创内容,未经账号授权,禁止随意转载。
1351