Vera Rubin Pod：黄仁勋甩出的AI终极杀器

相关内容请参考“DeepSeek v4：国产化训练从0到1里程碑，战略意义大于性能意义”，AI、芯片、半导体、大模型等“97个技术专栏”，请参考智能计算芯知识。

当AI正式进入智能体（Agent）时代，大模型之间的交互、长上下文记忆、混合专家（MoE）、强化学习已经把传统算力集群彻底榨干。英伟达没有选择升级显卡，而是直接重新定义了整座 AI 工厂——Vera Rubin Pod来了。

这不是一台服务器，不是一个机架，而是一套从芯片到电网、从计算到存储、从训练到推理完全重构的 POD 级 AI 超级计算机。它的目标只有一个：把每一度电，都变成 AI 的 token；把每一颗芯片，都跑在智能体的极致效率里。

一、Vera Rubin Pod 到底是什么？

它是英伟达用第三代 MGX 模块化架构做的一套 “超级 AI 一体机”。5 类专用机架，各司其职7 类芯片协同，全链路打通40 个机架组成一整座 “AI 工厂”算力高达60 EFLOPS，总带宽10PB/s。简单说：以前你买 GPU；现在，英伟达直接卖给你一整套可以立刻量产智能体 AI 的超级基础设施。

二、五大机架分工：像器官一样协同，缺一不可

Vera Rubin Pod 最恐怖的地方，是它把 AI 工作流拆成 5 个专属机架，各自专精、全线打通。

1）NVL72 核心计算机架：整座 AI 工厂的心脏

单机架塞进72 颗 Rubin GPU + 36 颗 Vera CPU，用第六代 NVLink 铜背板硬连在一起，相当于一整个机架变成一颗巨型 GPU。

训练性能比 Blackwell 高4 倍，推理能效高10 倍，单 GPU 带宽3.6TB/s，整机架带宽260TB/s，超过全球互联网总带宽它专门负责：MoE 路由、预训练、大模型推理。

2）Groq 3 LPX 低延迟推理机架：智能体 “秒回” 的关键

英伟达把 Groq 的 LPU 直接做成机架级引擎：256 颗 LPU 硬连万亿参数模型低延迟、大上下文；token 生成速度提升35 倍它解决的是：智能体必须快、必须稳、不能等。

3）Vera CPU 机架：强化学习与沙箱验证底座

智能体要试错、要模拟、要决策，全靠 CPU 沙箱。

单机架256 颗 Vera CPU，支持22500 个并发沙箱，能效提升2 倍，速度快 50%它是 AI 智能体的 “训练场”。

4）BlueField-4 STX 存储机架：AI 原生存储，专门存 KV Cache

这是全球第一个为 AI 设计的存储机架。

把 KV 缓存彻底从 GPU 剥离上下文容量无限扩展吞吐提升5 倍，能效提升5 倍，以后大模型再长的上下文，都不会爆显存。

5）Spectrum-6 SPX 网络机架：整台超算的 “神经中枢”

全机架用CPO 共封装光学、Spectrum-X、Quantum-X800 打通：102.4T 交换机512 端口、200G CPO 光模块近 100% 有效带宽、

零抖动它保证：所有机架像一台机器一样同步。

三、真正的黑科技：第三代 MGX 架构，从芯片到电网全优化

Vera Rubin Pod 强，不是强在堆芯片，而是强在工程设计。

1）无电缆模块化：装机从 2 小时缩到 5 分钟

MGX 用铜质背板取代几千根线缆，计算托盘即插即用。

维护性提升20 倍，单宽机架，运输部署极简单

2）45℃液冷：不用冷水机，PUE 接近极限

支持45℃温水直接冷，大部分地区可以无压缩机自然冷却。

省电、省水、省基础设施

3）智能电网级电源：峰值电流降 25%

三层电源黑科技：动态功率导向机架级电容储能平滑波动动态 Max-Q 释放闲置功率同一预算，多跑30% GPU。

四、扩展能力恐怖：从 72卡、576 卡到1152 卡

这套超算是真正能线性扩展的：NVL72：单机架 72 卡Ultra NVL576：8 机架拼成 576 卡统一域Kyber NVL1152：下一代 1152 卡超级集群

从实验室到千卡超算，一套架构打通。

五、Vera Rubin DSX：直接给你一座 “AI 工厂蓝图”

英伟达怕你不会搭，直接给了DSX 全栈参考平台：从芯片到电网的全套设计软件、API、库、管理工具全配齐落地速度提升数倍电网利用率大幅提升

这就是：你买的不是超算，是一整套赚钱的 AI 工厂。

六、结语：AI 基础设施的时代，彻底变了

Vera Rubin Pod 的发布，标志着一个时代结束：以后不再比谁显卡多，而是比谁的 AI 工厂更强。

它为智能体 AI 量身定做：低延迟、高吞吐、高能效、全链路、可扩展、可量产。

训练更强、推理更快、上下文更大、成本更低、功耗更优、部署更简单！

这就是英伟达的终极答案：不跟你拼芯片，我直接定义下一代 AI 基础设施。

免责申明：本号聚焦相关技术分享，内容观点不代表本号立场，可追溯内容均注明来源，发布文章若存在版权等问题，请留言联系删除，谢谢。

温馨提示：AI、芯片、半导体、大模型等“97个技术专栏”，请参考智能计算芯知识。