今年的 GTC Taipei 2026 刚刚落下帷幕,英伟达创始人黄仁勋,继续用传教士的方法,用一场信息量爆炸的演说,传教大家一个新时代的到来。
如果用一句话总结这次发布会的核心,那就是:NVIDIA 已经不再是一家单纯的“显卡/芯片公司”,它正变成一家兜售“AI 代理全栈基础设施”的工业巨头。
对于关注智能汽车、具身智能与前沿科技的Vehicle读者来说,这场演说透出的行业和职场风向。计算的底层逻辑变了,搞懂这些新词汇,才能看清未来十年的智能化路径。
接下来,我们用最接地气的科普视角,为你拆解本次 GTC 的硬核干货。
1、 算力新范式:真正能干活的“Agent”时代
过去两年,我们谈论的大多是“生成式 AI”——你给它一句话,它吐出一段文字或一张图。后来Open Claw龙虾来了,其实就预示着,今年全行业已经正式跨入代理式 AI(Agentic AI)时代。
什么是“AI 代理(Agent)”?很多人都明白,它不再是一个只懂有问必答的对话框,而是一个有思考能力、会自己调用工具解决复杂问题的“数字员工”。
但是,本次会议上黄仁勋在现场给大家科普和解构了现代 Agent 的全新公式:
Agent = 大脑(大语言模型) + 身体(Harness 软件外壳) + 工具(CUDA X 工具库)
大脑(LLM):负责理解你的意图,并进行逻辑推理。
身体(Harness 外壳):相当于操作系统的内存管理系统,管理长短期记忆,给大脑指派任务。
工具:过去那些复杂的工业软件、数据库(比如英伟达的 CUDA X 库),现在都配上了说明书。Agent “大脑”一读,就能像熟练工一样自己去调用这些工具,根本不需要人类在键盘上点击和打字。
按照这个推理,那么AI 生产的最终商品变成了Token(标记)。Token 不仅是字符,更是知识、理性和行动的单位。黄仁勋算了一笔账:全球 3000 万软件工程师创造了约 3 万亿美元的产值,而通过 Agent 的辅助,直接撬动了接近 9 万亿美元的生产力。
当“Tokens per Watt(每瓦电力产出的 Token 数量)就是纯利润”成为新铁律时,算力中心就变成了“Token 制造工厂”。
这就解释了,为什么现在全行业都在疯狂建 AI 工厂?
这也是为什么全球 IT 供应链(尤其是台湾硬件生态)的需求会迎来火箭般飙升的根本原因,投资算力厂,投资电力设备基建等。
2、 硬件大变阵:为“急性子”的 AI 代理定制芯片
既然算力工厂都在生产 Token,自主给人打工,黄仁勋就推断,那么传统的计算机硬件就必须全部推倒重来。本次GTC英伟达祭出了两大硬核杀器:
1. Vera CPU:造GPU的英伟达也造CPU了
过去,世界上所有的 CPU 都是为“人类”设计的。人类习惯按“秒”思考,而AI 代理活在“纳秒”的世界里。
当一个 Agent 频繁调用数据库或工具时,如果 CPU 响应慢了,旁边价值连城、极其昂贵的 GPU 就会陷入闲置等待。于是,为了不让 CPU 拖后腿,英伟达推出了起CPU Vera。
黄仁勋表示,这款CPU它不追求盲目堆砌核心,而是死磕单线程性能,连接速度快到彻底消除了传统芯片拼接的延迟惩罚。用它跑数据库查询,速度直接飙升到传统架构的 3 到 6 倍!
2. Vera Rubin 架构:全面量产的超级中枢
黄仁勋宣布Vera Rubin 已经进入全面量产阶段。它不是单枚芯片,而是一个极其庞大的系统。
因为异构计算和内存管理极其复杂,英伟达通过“极限协同设计”,在主板背板上彻底取消了错综复杂的外部线缆和软管。过去组装这样一个 Grace Blackwell 机架需要 2 小时,现在组装全新的 Vera Rubin 机架仅需 5 分钟。它集成了台积电 3nm 工艺、首发HBM4内存,以及 200G CPO(光电共封装)技术。
为了让造价动辄数百上千亿美元的 AI 工厂不翻车,英伟达还推出了DSX 蓝图。在工厂落地前,先在 Omniverse 数字孪生里把电力、液冷、网络 100% 模拟一遍,甚至能通过 45°C 高温液冷技术和实时电网信号调节,榨干每一瓦电力的价值。
3、 汽车与具身智能变天:Cosmos 3 与能“碎碎念”的 Alpamo 2
这部分是 Vehicle 读者最关心的焦点。黄仁勋表示发展物理 AI,不管是智能汽车(自动驾驶)还是人形机器人,目前面临一个共同的致命瓶颈:第一人称数据的缺失。
互联网上有海量的猫狗视频、街拍视频,但这些都是“第三人称视角”的旁观记录。机器人或汽车要自己学会走、学会开,需要的是“我知道我做出这个动作后,世界会变成什么样”的第一人称感知数据。
为了解决这个终极难题,英伟达发布了物理 AI 开放大模型 ——Cosmos 3。
Cosmos 3:物理世界的“全能模拟器”
Cosmos 3 采用了创新的MoT(混合变压器)架构。它不仅是一个能精准看懂物理危险的VLM视觉语言模型,更是一个“世界模型(World Model)”。
你给它一张照片或一段文字,它就能自主生成完全符合现实世界物理定律的合成视频。这就相当于在虚拟世界里创造了一个完美的闭环,让算力直接转化为源源不断的高质量具身训练数据,自己充当机器人的物理老师。
基于 Cosmos 3 的底层技术,英伟达对自动驾驶和人形机器人分别推出两项重磅应用:
Alpamayo 2 开源自动驾驶大模型:
Alpamayo 是一款面向自动驾驶的开放式推理 VLA 模型,它基于NVIDIA Cosmos 构建,能够处理多摄像头视频、导航输入和驾驶环境信息,从而生成轨迹和因果链推理轨迹。Alpamayo 1 Nano 和 1.5 Nano 提供 100 亿参数的处理能力,而 Alpamayo 2 Super 则可扩展至 320 亿参数。
Alpamayo 2重要的核心力是推理能力进一步加强。支持深度学习逻辑“具现化、可解释化”。
Isaac Groot 人形机器人开源开发平台:
和Alpamayo 类似,Isaac Groot英伟达联手 Sharpa 打造了一款身高 6 英尺、体重 150 磅的参考硬件且融合英伟达算法和工具。
它运行全新的 Thor 芯片,双手各自拥有极其灵活的 25 个自由度(全身 31 个自由度)。这套平台把从仿真、数据合成到端到端运行的软硬件全部打通且完全模块化,让科研团队在数小时内就能直接展开前沿的具身智能研究。
4、 你的下一台 PC,是一个 24小时在家的私人超算
最后,老黄还顺便重构了我们桌上的个人电脑(PC)。微软与英伟达秘密筹备三年,推出了RTX Spark 移动处理器(芯片代号 N1X)。
这枚联手联发科、基于台积电 3nm 工艺打造的芯片,在单片上熔接了 Blackwell 架构 GPU 和 20 核定制 Grace CPU。它能跑出 1 Petaflop(千万亿次)的顶级 AI 算力,完美兼容英伟达 100% 的软件栈。
在未来,大语言模型将直接扮演 PC 智能化延伸的底层 API(类似现代版“DirectX”)。在现场演示中,常驻在本地的 AI 代理通过安全沙盒,能自主打开专业设计软件 Rhino 调整地形,自己默默修改 Bug,得到允许后自动导入 Blender 并调用 Flux 2 模型渲染出照片级的光影图。
黄仁勋预言:15 年前手机被称为“Phone”,如今我们很少用它打电话;10 年后,PC 的概念也将被彻底颠覆。你的家里除了电视、洗衣机,必然还会安放一台本地 AI 超算,它更像《星球大战》里的 R2-D2,不知疲倦地帮你调遣代理、处理琐事。
结语
从让电脑显示 3D 图形的 GPU,到驱动万物互联与物理世界的 AI 工厂,NVIDIA 用 Vera Rubin、Vera CPU、Cosmos 3 和 RTX Spark,把一整块“五层计算大蛋糕”切碎了喂给了这个时代。
物理世界与数字世界的边界正在被算力粗暴地抹平。当汽车开始“一边思考一边碎碎念”,当机器人开始在虚拟的物理模拟器里疯狂进化,我们所谈论的“智能化”,已经不再是堆砌功能的配置表,而是一场关于 Token 吞吐量与物理世界模型效率的终极军备竞赛。
主要信息来源:英伟达GTC Taipei 2026 ppt以及演讲视频。
*未经准许严禁转载和摘录-获取本文参考资料方式:加入我们的知识星球可以下载公众号海量参考资料包含以上参考资料。
1154
