相关内容请参考“DeepSeek v4:国产化训练从0到1里程碑,战略意义大于性能意义”,AI、芯片、半导体、大模型等“97个技术专栏”,请参考智能计算芯知识。
当AI正式进入智能体(Agent)时代,大模型之间的交互、长上下文记忆、混合专家(MoE)、强化学习已经把传统算力集群彻底榨干。英伟达没有选择升级显卡,而是直接重新定义了整座 AI 工厂——Vera Rubin Pod来了。
这不是一台服务器,不是一个机架,而是一套从芯片到电网、从计算到存储、从训练到推理完全重构的 POD 级 AI 超级计算机。它的目标只有一个:把每一度电,都变成 AI 的 token;把每一颗芯片,都跑在智能体的极致效率里。
一、Vera Rubin Pod 到底是什么?
它是英伟达用第三代 MGX 模块化架构做的一套 “超级 AI 一体机”。5 类专用机架,各司其职7 类芯片协同,全链路打通40 个机架组成一整座 “AI 工厂”算力高达60 EFLOPS,总带宽10PB/s。简单说:以前你买 GPU;现在,英伟达直接卖给你一整套可以立刻量产智能体 AI 的超级基础设施。
二、五大机架分工:像器官一样协同,缺一不可
Vera Rubin Pod 最恐怖的地方,是它把 AI 工作流拆成 5 个专属机架,各自专精、全线打通。
1)NVL72 核心计算机架:整座 AI 工厂的心脏
单机架塞进72 颗 Rubin GPU + 36 颗 Vera CPU,用第六代 NVLink 铜背板硬连在一起,相当于一整个机架变成一颗巨型 GPU。
训练性能比 Blackwell 高4 倍,推理能效高10 倍,单 GPU 带宽3.6TB/s,整机架带宽260TB/s,超过全球互联网总带宽它专门负责:MoE 路由、预训练、大模型推理。
2)Groq 3 LPX 低延迟推理机架:智能体 “秒回” 的关键
英伟达把 Groq 的 LPU 直接做成机架级引擎:256 颗 LPU 硬连万亿参数模型低延迟、大上下文;token 生成速度提升35 倍它解决的是:智能体必须快、必须稳、不能等。
3)Vera CPU 机架:强化学习与沙箱验证底座
智能体要试错、要模拟、要决策,全靠 CPU 沙箱。
单机架256 颗 Vera CPU,支持22500 个并发沙箱,能效提升2 倍,速度快 50%它是 AI 智能体的 “训练场”。
4)BlueField-4 STX 存储机架:AI 原生存储,专门存 KV Cache
这是全球第一个为 AI 设计的存储机架。
把 KV 缓存彻底从 GPU 剥离上下文容量无限扩展吞吐提升5 倍,能效提升5 倍,以后大模型再长的上下文,都不会爆显存。
5)Spectrum-6 SPX 网络机架:整台超算的 “神经中枢”
全机架用CPO 共封装光学、Spectrum-X、Quantum-X800 打通:102.4T 交换机512 端口、200G CPO 光模块近 100% 有效带宽、
零抖动它保证:所有机架像一台机器一样同步。
三、真正的黑科技:第三代 MGX 架构,从芯片到电网全优化
Vera Rubin Pod 强,不是强在堆芯片,而是强在工程设计。
1)无电缆模块化:装机从 2 小时缩到 5 分钟
MGX 用铜质背板取代几千根线缆,计算托盘即插即用。
维护性提升20 倍,单宽机架,运输部署极简单
2)45℃液冷:不用冷水机,PUE 接近极限
支持45℃温水直接冷,大部分地区可以无压缩机自然冷却。
- 省电、省水、省基础设施
3)智能电网级电源:峰值电流降 25%
三层电源黑科技:动态功率导向机架级电容储能平滑波动动态 Max-Q 释放闲置功率同一预算,多跑30% GPU。
四、扩展能力恐怖:从 72卡、576 卡到1152 卡
这套超算是真正能线性扩展的:NVL72:单机架 72 卡Ultra NVL576:8 机架拼成 576 卡统一域Kyber NVL1152:下一代 1152 卡超级集群
从实验室到千卡超算,一套架构打通。
五、Vera Rubin DSX:直接给你一座 “AI 工厂蓝图”
英伟达怕你不会搭,直接给了DSX 全栈参考平台:从芯片到电网的全套设计软件、API、库、管理工具全配齐落地速度提升数倍电网利用率大幅提升
这就是:你买的不是超算,是一整套赚钱的 AI 工厂。
六、结语:AI 基础设施的时代,彻底变了
Vera Rubin Pod 的发布,标志着一个时代结束:以后不再比谁显卡多,而是比谁的 AI 工厂更强。
它为智能体 AI 量身定做:低延迟、高吞吐、高能效、全链路、可扩展、可量产。
- 训练更强、推理更快、上下文更大、成本更低、功耗更优、部署更简单!
这就是英伟达的终极答案:不跟你拼芯片,我直接定义下一代 AI 基础设施。
免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。
温馨提示:AI、芯片、半导体、大模型等“97个技术专栏”,请参考智能计算芯知识。
569