在最近的特斯拉 2026 年第一季度财报电话会议上,首席执行官埃隆·马斯克确认现在配置的 HW3 无法实现完全自动驾驶 FSD,也就是不能够跑当前最先进不裁剪的V14和未来的V15.
马斯克电话会议上透露,HW3 无法实现无人值守的 FSD(完全自动驾驶)的原因是,内存带宽,它的只有 AI4 的八分之一。
目前特斯拉HW 3的车辆大约有400万车主,未来如果要免费升级或赔偿,马斯克给的解决方案竟然是建造整座工厂来专门处理这些升级。
同时马斯克透露,特斯拉计划对其自动驾驶计算机进行“AI4.1 或 AI4 Plus”升级,将每个芯片的 RAM 从 16 GB 增加到 32 GB,使系统总内存达到 64 GB。并且算力可能增加 10%,达到数万亿次操作每秒,可能会在2027年中投产。这取决于三星何时完成这些修改并将其投入生产。
内存带宽问题
AI4 目前采用 GDDR6 显存,带宽约为 384 GB/s,相比 HW3 的 LPDDR4 显存有了显著提升,甚至超过了 NVIDIA 的 Orin(约 205 GB/s)以及更新的 Thor(约 273 GB/s)。
AI4 的不足之处在于总显存容量:32GB,而 Orin 为 64GB。要理解 HW3 的困境,我们需要看透底层硬件的差异。特斯拉 HW3: 采用的是相对老旧的 LPDDR4 内存。
特斯拉 AI4(HW4): 升级到了 GDDR6 内存,这使其内存带宽实现了质的飞跃,达到了约 384 GB/s。为什么这个 384 GB/s 的带宽差距如此致命?
在传统的模块化智驾架构(感知、规控、执行)中,系统被切割成多个小任务,我们可以对各个模块进行分段优化。但当行业不可逆转地走向端到端大模型,探索基于 Vision-Language-Action (VLA)/世界模型等架构时,游戏规则改变了。
这类庞大的、未经大幅剪枝的单体神经网络,在推理时需要将海量的参数数据同时搬运到处理器中。这就好比你拥有一个极其强壮的胃(高 TOPS 算力),但食管太细(低内存带宽)。无论处理器的理论上限有多高,只要数据传输的通道被堵死,计算核心就只能处于“饥饿”和“闲置”状态,干等数据输入。
HW3 的 LPDDR4 根本无法提供端到端模型在所需帧率下运转的数据吞吐量。从 HW3 到 AI4 的跨越,扯下了“算力即正义”的遮羞布。自动驾驶的终局竞争,是一场关于数据吞吐率、模型效率与硬件成本的极致平衡。
未经准许严禁转载和摘录-获取本文参考资料方式:加入我们的知识星球可以下载公众号海量参考资料包含以上参考资料。
1078