• 正文
  • 相关推荐
申请入驻 产业图谱

英伟达在自动驾驶领域做了哪些技术探索?

12小时前
312
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

 

近几年,自动驾驶技术正在从技术验证阶段向规模化部署过渡,这对计算基础设施、模型架构、安全体系与仿真工具提出了更高要求。英伟达近年来在自动驾驶领域持续投入,形成了从车端芯片到云端训练、从推理模型到安全系统的完整技术方案。

2026年1月CES上,英伟达发布了Alpamayo系列AI模型和工具,并扩展了DRIVE Hyperion全球生态系统,新增Aeva、博世、采埃孚等传感器合作伙伴。3月GTC大会上,英伟达汽车副总裁吴新宙指出,全球约13万亿英里的出行里程中,自动驾驶占比仅约0.006%,行业面临的现实问题是如何从小规模验证走向规模化应用。

大会上,英伟达发布了Alpamayo 1.5推理模型、Halos OS安全架构以及NuRec仿真工具,并宣布比亚迪、吉利、五十铃、日产等车企加入DRIVE Hyperion平台生态,共同推进L4级自动驾驶车辆量产。6月GTC台北大会上,英伟达进一步推出参数规模达320亿的Alpamayo 2 Super推理模型,以及专为物理AI打造的开放世界基础模型Cosmos 3,将自动驾驶技术体系推向新的完整度。今天就带大家一起聊聊英伟达为自动驾驶做了哪些技术支撑。

模型架构,从轨迹生成到推理决策

英伟达为自动驾驶设计的模型体系以视觉、语言、动作模型为核心,覆盖从云端训练到车端部署的完整链路。

2026年1月,英伟达在CES上首次发布了Alpamayo平台,包含参数规模为100亿的VLA模型Alpamayo R1、开源模拟框架AlpaSim,以及涵盖1727小时、来自25个国家的驾驶数据集等三大核心组件。该模型的输入包含视频序列、自车运动历史、导航路径以及自然语言提示,输出为带有推理过程的驾驶轨迹。开发人员可以通过自然语言对模型的驾驶行为施加约束,模型会将指令转化为路径约束并执行。

2026年6月,英伟达在GTC台北大会上推出了Alpamayo 2 Super模型,其参数规模扩展至320亿,成为英伟达迄今最大的自动驾驶开源推理模型。该模型基于NVIDIA Cosmos世界基础模型构建,输入视野从前向摄像头扩展至全车环视,覆盖前后及侧方视野,在长尾场景下的逻辑推理、三维空间感知和轨迹预测能力均有显著增强。

模型具备元动作输出能力,能够预判礼让、变道、停车等高层级驾驶行为,输出结构化的驾驶意图而非仅输出轨迹点,使下游规划与控制模块获得更明确的指令。模型同时具备推理式自动标注能力,可在训练数据中生成带有二维目标定位的因果链标签,将标注周期从数月缩短至数日,在GitHub上开源的因果链自动标注流水线支持从原始行车视频自动生成带因果关联的标注数据。

Alpamayo 2 Super还采用教师-学生蒸馏架构,320亿参数的教师模型运行在云端,处理大规模数据并生成高精度伪标签,通过知识蒸馏得到的轻量化学生模型部署在车端芯片上。Alpamayo系列模型自发布以来累计下载量已接近40万次,在Hugging Face平台上排名领先,并获得了台北国际电脑展车载技术与智能座舱类最佳选择奖。

计算平台,车端与云端的算力底座

英伟达的车载计算平台以DRIVE AGX Thor为核心,Thor芯片基于Blackwell GPU架构,支持4位浮点精度计算,可提供2000 FP4 TFLOPS的AI算力(等效约1000 INT8 TOPS),相比前代DRIVE Orin实现了约7.5倍的性能提升。芯片内部集成了Transformer加速引擎,专门用于VLA模型中的自注意力计算,芯片内部还包含功能安全岛,用于持续监控主计算单元的状态。

DRIVE Hyperion是基于Thor构建的整车参考平台,Hyperion包含传感器配置、线束布置、散热设计以及基础软件层。Hyperion 10版本搭载两颗DRIVE AGX Thor芯片,合计提供超过2000 FP4 TFLOPS的实时计算能力。

DRIVE Hyperion 10作为英伟达推出的统一L4级自动驾驶参考架构,其官方标准传感器配置为14个外部高清摄像头、9个毫米波雷达、1个激光雷达和12个超声波传感器,搭载两颗NVIDIA DRIVE AGX Thor系统级芯片,单颗芯片在FP4精度下算力超过2000 TFLOPS,平台通过NVIDIA Halos端到端安全框架全面满足ISO 26262 ASIL-D功能安全与ISO 21434网络安全标准,硬件设计支持多模态冗余与单点故障安全降级。

2026年1月,禾赛科技正式成为该平台的官方激光雷达合作伙伴,其ETX激光雷达完成适配认证,为生态提供可选方案;比亚迪、吉利、五十铃、日产、现代汽车等车企也已加入生态,其中比亚迪与吉利基于该平台开发下一代乘用车自动驾驶系统,五十铃联合TIER IV利用核心组件开发L4级自动驾驶巴士,日产采用Hyperion 10硬件架构并由Wayve提供软件方案,而吉利旗下极氪品牌推出的极氪9X车型,在官方平台基础上扩展为5颗激光雷达与增强型感知系统,并于2026年1月获得杭州市全域L3级自动驾驶道路测试牌照,覆盖9224平方公里,为全国通行面积最大、里程最长的L3测试权限。

安全框架,从芯片到云端的全栈防护

英伟达的Halos安全框架覆盖芯片、操作系统、中间件、算法模型和云端仿真五个内容。Halos OS是该框架的核心组件,于2026年3月GTC大会上首次发布,6月正式推出完整版本。

Halos OS基于DriveOS构建,通过了ISO 26262 ASIL-D最高功能安全认证,OS分为三个层级。操作系统层(Halos Core)包含对NVIDIA CUDA和TensorRT的安全认证支持,Hypervisor能隔离安全关键功能,并提供TensorRT Edge-LLM开源框架用于车端运行大语言模型推理。中间件层提供了标准化的传感器抽象和车辆抽象接口,添加或更换传感器不需要修改应用程序代码。安全应用层则集成了基于规则的功能,为AI提供安全护栏,包括DRIVE主动安全堆栈,具备自动紧急制动、车道偏离预警、盲点监测等功能,符合Euro NCAP五星标准。

Halos还引入了多层安全护栏机制。第一层护栏监测输入数据的完整性,如监测摄像头图像是否出现丢帧或校验错误;第二层护栏监测模型输出的合理性,如规监测划轨迹是否超出车辆物理极限;第三层护栏监测执行层的反馈,如监测方向盘转角指令是否被正确执行。当任何一层护栏触发异常时,系统会按照预设的降级策略切换到冗余计算单元或请求驾驶员接管。

2026年3月,英伟达宣布建立Halos AI Systems Inspection Lab。该实验室配备完整的车辆在环测试台架和场景注入工具,对整车级自动驾驶系统进行安全评估。检测项目包括感知系统鲁棒性、规划系统在长尾场景下的行为一致性、以及控制系统在硬件失效后的容错能力。英伟达同时与广达、禾赛、法雷奥等生态伙伴签署Halos安全合作,共同推进安全验证标准。

仿真工具链,数据闭环与加速验证

仿真工具链是英伟达自动驾驶技术体系的关键组成部分,以Cosmos 3世界基础模型为核心。Cosmos 3于2026年6月发布,是全球首款完全开放的全模态物理AI模型,其基于混合Transformer架构构建,能够原生理解并生成文本、图像、视频、环境音和动作。

Cosmos 3解决了物理AI的一项核心难题,可以使机器人和智能汽车在训练数据有限和仿真环境碎片化的情况下,在现实世界中进行泛化。该模型基于数十亿条文本、图像、视频、声音和动作轨迹样本进行训练,开发者可将Cosmos 3用作视觉语言模型进行环境感知推理,或用作世界模型模拟物理环境并预测未来世界状态,以进行训练和评估。

模型同时内置了世界动作模型的能力,可用于训练和执行特定任务,在物理AI基准测试的公开评测中,Cosmos 3在开放模型类别中取得了领先结果,其世界生成准确率和动作策略指标均排名前列。英伟达同时成立了Cosmos Coalition,与Agile Robots、Black Forest Labs、Runway等机构共同推动世界模型发展。

对于已采集的真实路测数据,英伟达则提供了Omniverse NuRec神经重建模型。NuRec配套Fixer、Harvester等生成式模型,用于构建和扩展自动驾驶场景,开发者可以将真实车队数据重建为高保真3D场景,并在场景中改变光照、天气、路面附着系数等参数,插入新的动态障碍物,实现数据规模化扩展。此外,Cosmos工具可将同一场景扩展至不同天气和城市环境,相关仿真体系已在英伟达内部实现每天约200万次测试,用于模型验证与迭代。

在Alpamayo 2 Super发布时,英伟达还同步推出了AlpaGym闭环强化学习框架和OmniDreams生成式世界模型。AlpaGym是一个高吞吐量闭环强化学习平台,模型在仿真环境中可经历连续的决策、观察循环,每次动作对环境产生真实影响,仿真反馈直接连接到策略训练循环,使模型暴露静态数据集无法发现的复合错误和边缘故障。OmniDreams可生成逼真且多样化的长尾驾驶场景,支持大规模仿真罕见场景。

整套仿真工具链与云端计算资源集成,使自动驾驶开发流程类似于软件工程,即可以做到数据采集、模型训练、仿真验证、上车部署、问题反馈与再训练形成闭环。英伟达内部模型迭代已可做到每天发布多个版本,测试到上线周期缩短至数小时级别。

整体技术架构

英伟达在自动驾驶领域的技术覆盖了模型、计算、安全、仿真四个环节,英伟达汽车副总裁吴新宙将其概括为三台计算机,即云端训练、云端仿真以及车端推理,三个环节在同一体系内协同运行。

模型层提供Alpamayo VLA推理模型系列,具备可解释性和教师-学生蒸馏能力;计算层以DRIVE AGX Thor芯片和DRIVE Hyperion参考平台为基础,提供可扩展的硬件底座;安全层通过Halos OS实现全栈功能安全与评估;仿真层利用Cosmos 3、NuRec、AlpaGym和OmniDreams构成数据闭环与验证体系。四层能力共同构成了从云端训练到车端部署的完整开发与部署平台,为自动驾驶从技术验证走向规模化运营提供了基础设施。

英伟达

英伟达

NVIDIA(中国大陆译名:英伟达,港台译名:辉达),成立于1993年,是一家美国跨国科技公司,总部位于加利福尼亚州圣克拉拉市,由黄仁勋、克里斯·马拉科夫斯基(Chris Malachowsky)和柯蒂斯·普里姆(Curtis Priem)共同创立。公司早期专注于图形芯片设计业务,随着公司技术与业务发展,已成长为一家提供全栈计算的人工智能公司,致力于开发CPU、DPU、GPU和AI软件,为建筑工程、金融服务、科学研究、制造业、汽车等领域的计算解决方案提供支持。美国GPU及AI计算巨头,传感器技术应用于自动驾驶及机器人领域。

NVIDIA(中国大陆译名:英伟达,港台译名:辉达),成立于1993年,是一家美国跨国科技公司,总部位于加利福尼亚州圣克拉拉市,由黄仁勋、克里斯·马拉科夫斯基(Chris Malachowsky)和柯蒂斯·普里姆(Curtis Priem)共同创立。公司早期专注于图形芯片设计业务,随着公司技术与业务发展,已成长为一家提供全栈计算的人工智能公司,致力于开发CPU、DPU、GPU和AI软件,为建筑工程、金融服务、科学研究、制造业、汽车等领域的计算解决方案提供支持。美国GPU及AI计算巨头,传感器技术应用于自动驾驶及机器人领域。收起

查看更多

相关推荐