扫码加入

  • 正文
  • 相关推荐
申请入驻 产业图谱

卖铲人的新战事:黄仁勋眼中万亿美元的AI“Token工厂”

7小时前
185
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

作者 | 王凌方 编辑 | 章涟漪

在GTC 2026舞台上,英伟达CEO黄仁勋这次讲演的重点不再是芯片,而是向全世界展示了一张图——一张关于“工厂”的蓝图。

这座工厂不生产钢铁,不组装汽车,它的产品是一种看不见摸不着的东西:Token。黄仁勋告诉在场所有人,到2027年,全球对这座工厂产出的需求,将至少达到1万亿美元。“我确定,实际的计算需求会比这高得多。”

这是对2026财年四季报电话会他透露的增长路径的具体回应,他用两个小时拆解了这个需求。

至此,英伟达正式从一家“芯片公司”转型为“AI基础设施和工厂公司”。

当然,芯片依然要升级,黄仁勋也在讲演中,剧透了下一代架构——Feynman,采用台积1.6nm制程,引入光通信技术,相比现有架构,将实现算力的大幅提升和能耗的显著降低,这是支撑百万倍算力需求的硬件核心。

01英伟达的身份跃迁

“去年这个时候,我说过,我们看到了5000亿美元的高确信度需求。现在,就在此时此地,我看到到2027年至少有1万亿美元的需求。”黄仁勋在演讲时这样说道。

不过,这次叙事逻辑变了,不是卖了多少GPU。他讲的是如何建造低成本“Token工厂”。

“每一座数据中心、每一座工厂,从定义上来说都是受电力限制的。一座1GW的工厂永远不会变成2GW,这是物理和原子的定律。”黄仁勋说,“在固定的功率下,谁的每瓦Token吞吐量最高,谁的生产成本就最低。”

这是一个彻底的思维转变:数据中心不再是存放文件的仓库,而是生产Token的工厂。英伟达不再只是提供“生产设备”的供应商,而是整座工厂的设计者、建设者和运维标准的制定者。

Vera Rubin系统的发布正是这一改变的体现。“过去提到Hopper,我会举起一块芯片,那很可爱。但提到Vera Rubin,大家想到的是整个系统。”黄仁勋说。

这个100%液冷、彻底消灭传统线缆的系统,将机架安装时间从两天缩短到两小时。更关键的是,1吉瓦AI工厂的token生成速率将从200万token/秒提升至7亿token/秒,提升了350倍。作为对比,摩尔定律在同期的提升幅度,只有约1.5倍。

这不是“卖芯片”的逻辑,这是“卖整厂”的逻辑。

02Token成为新石油

支撑这1万亿美元预期的,是黄仁勋提出的“Token工厂经济学”。

他将未来的AI服务划分为五个商业层级:免费层(高吞吐、低速度)、中级层(约每百万token3美元)、高级层(约每百万token6美元)、高速层(约每百万token45美元)、超高速层(约每百万token150美元)。

“在这个Token工厂里,你的吞吐量和Token生成速度,将直接转化为你明年的精确收入。”黄仁勋这样说道。

这是一套将算力转化为可定价商品的完整逻辑。Token成为像石油、电力一样的“大宗商品”,而英伟达的架构,决定了客户能以多低的成本生产这种商品。

以简化模型估算,将25%占有率平均分配给四个层级,Grace Blackwell可比Hopper多产生5倍的收入。在最高价值的推理层级,性能提升达到惊人的35倍。

这正是黄仁勋所说的“成本最低的基础设施”的真正含义。由于英伟达能运行几乎所有领域的AI模型,这种通用性使得客户投入的“基建”能够被充分利用,并保持长久的生命周期。

目前,英伟达60%的业务来自全球前五大超大规模云服务商,剩余40%遍布区域云、主权云、企业、工业、机器人、边缘计算等各个领域。“AI的覆盖广度本身就是其韧性所在,”黄仁勋说,“这毫无疑问是一次全新的计算平台变革。”

03硬件、软件与生态的协同

英伟达的“铲子”不是单一产品,而是一个硬件、软件和生态,三位一体的体系,更难取代。

硬件方面,Vera Rubin是一个完整的、端到端优化的系统,专为智能体(Agentic)工作负载设计。

全新Vera CPU是专为极高单线程性能设计,采用LPDDR5内存,兼具卓越能效,是全球唯一使用LPDDR5的数据中心CPU,适合AI智能体工具调用。

存储系统方面,BlueField 4+CX 9,面向AI时代的全新存储平台,全球存储行业100%加入。

CPO Spectrum X交换机是全球首款共封装光学以太网交换机,已全面量产。

Kyber机架是全新机架系统,支持144块GPU组成单一NVLink域,前端计算、后端NVLink交换,形成一台巨型计算机

Rubin Ultra作为下一代超算节点,竖插式设计,配合Kyber机架,支持更大规模NVLink互联。

但更值得关注的,是英伟达对Groq的整合。

Groq芯片拥有500MB的SRAM,而一颗Rubin芯片拥有288GB的内存。两者特性截然不同。英伟达通过Dynamo软件系统,将需要海量计算和显存的“预填充”阶段交给Vera Rubin,将对延迟极度敏感的“解码”阶段交给Groq。

“如果你的工作主要是高吞吐,100%使用Vera Rubin;如果你有大量高价值的编程级别的Token生成需求,拿出25%的数据中心规模给Groq。”黄仁勋给出了这样的配置建议。

据透露,由三星代工的Groq LP30芯片已在量产,预计今年第三季度出货,而首个Vera Rubin机架已在微软Azure云上运行。

软件方面,二十年磨一剑的CUDA护城河。

“今年是CUDA诞生二十周年。”黄仁勋在演讲中特别强调。

历经二十年,全球已积累数亿块运行CUDA的GPU和计算系统,覆盖所有云平台,服务于几乎所有计算机厂商和行业。

“装机量吸引开发者,开发者创造新算法并取得突破,突破催生全新市场,新市场形成新生态并吸引更多企业加入,进而扩大装机量——这个飞轮正在持续加速。”

这个飞轮带来的直接结果是,英伟达GPU的实际使用价值极高。黄仁勋举了一个反常识的例子:六年前发布的Ampere架构GPU,其云端价格反而在上涨。

“原因显而易见:NVIDIA CUDA上可运行的应用极为丰富,涵盖AI生命周期的每个阶段、各类数据处理平台,以及各种科学原理求解器。因此,一旦安装了英伟达GPU,其使用价值极高。”

在结构化数据处理方面,英伟达推出了cuDF和cuVS两个基础库,与IBM、Dell、GoogleCloud达成合作,帮助Snapchat将计算成本降低近80%。在非结构化数据方面,向量数据库、PDF、视频、音频的处理能力,让过去无法被利用的数据现在成为AI的养料。

生态方面,与云厂商的深度捆绑。

“英伟达与全球云服务商建立了特殊的合作关系——我们将客户引入云端,这是一种互利共赢的生态。”

在GoogleCloud,英伟达加速VertexAI和BigQuery,与JAX/XLA深度集成,将Base10、CrowdStrike、Puma、Salesforce等客户引入生态。

在AWS,英伟达加速EMR、SageMaker和Bedrock,今年更将把OpenAI引入AWS,帮助其扩展区域部署和计算规模。

在Microsoft Azure,英伟达100PFLOPS超算是第一台部署在Azure上的超算,奠定了与OpenAI合作的重要基础。英伟达GPU还是全球首批支持保密计算的GPU,可支持OpenAI和Anthropic模型在全球各地区云环境中的保密部署。

在Oracle,英伟达是第一个AI客户。“我为能够第一次向Oracle解释AI云的概念感到自豪。”黄仁勋说。

此外,Core Weave成为全球第一家AI原生云,Palantir与Dell联合打造了可在任何国家、任何气隙隔离环境下完全本地化部署的AI平台。

“英伟达是全球第一家垂直整合、横向开放的公司。”黄仁勋这样定义自己的战略,“我们必须理解应用,理解领域,深刻理解算法,并能够将其部署在任何场景下——数据中心、云端、本地、边缘乃至机器人系统。同时,英伟达保持横向开放,愿意将技术整合进任何合作伙伴的平台。”

04重构企业IT与职场规则

黄仁勋将开源项目OpenClaw形容为“人类历史上最受欢迎的开源项目”,称其仅用几周时间就超越了Linux在过去30年取得的成就。他直言:“OpenClaw本质上就是智能体计算机的操作系统。”

OpenClaw能够管理资源,访问工具、文件系统和大型语言模型,执行调度和定时任务,将问题逐步分解并调用子智能体,支持任意模态的输入输出。

“Windows让个人计算机成为可能,OpenClaw让个人智能体成为可能。”黄仁勋说,“每一家企业都需要制定自己的OpenClaw战略,正如我们都需要Linux策略、HTML策略、Kubernetes策略一样。”

这带来的是一场企业IT的全面重塑。黄仁勋断言:“每一个SaaS公司都将变成AaaS(智能体即服务)公司。”

但智能体能够访问敏感数据、执行代码、与外部通信,这带来了全新的安全挑战。为此,英伟达与Peter合作,将安全性融入企业级版本,推出NeMoClaw参考设计和OpenShield安全层。

“这是企业IT的文艺复兴,”黄仁勋说,“一个原本2万亿美元规模的产业,即将成长为数万亿美元规模,从提供工具转向提供专业化的AI智能体服务。”

他甚至描绘了未来职场的新形态:“在未来,我们公司的每一位工程师都需要一个年度Token预算。他们的基础年薪可能是几十万美元,我会在此基础上再拿出大约一半的金额作为Token额度给他们,让他们实现10倍效率提升。这已经是硅谷的新招聘筹码了:你的offer里带多少Token?”

未来的软件,不再是 “人操作工具”,而是 “智能代理与人协作”,而英伟达的技术,就是为这种全新的软件形态打造的核心支撑。

05未来战场:物理AI与机器人、太空数据中心

数字智能体在数字世界中行动,而物理AI则是具身化的智能体——机器人。

本次GTC共有110款机器人亮相,几乎囊括全球所有机器人研发企业。

自动驾驶方面,黄仁勋宣布四家新合作伙伴加入英伟达Robotaxi Ready平台:比亚迪、现代、日产、吉利,合计年产量1800万辆。加上此前的奔驰、丰田、通用,阵容进一步壮大。同时与Uber达成重大合作,将在多个城市部署并接入RoboTaxi Ready车辆。

工业机器人方面,ABB、UniversalRobotics、KUKA等企业与英伟达合作,将物理AI模型与仿真系统相结合。

电信领域,卡特彼勒和T-Mobile也在合作之列。未来无线基站将不再是通信节点,而是NVIDIAAerialAIRAN——能够实时感知流量、调整波束成形,实现节能增效的智能化边缘计算平台。

特别引人注目的是与Disney合作的Olaf机器人亮相。这个在Omniverse中学会走路的雪人,基于NVIDIAWarp运行的Newton求解器(与Disney和DeepMind联合开发),能够适应真实的物理世界。

“你能想象吗?未来的迪士尼乐园——所有这些机器人角色在园区里自由漫步。”黄仁勋说。

而更令人遐想的是,英伟达正在进军太空。Thor芯片已通过辐射认证,正在卫星中运行。此外,英伟达正在研发部署在太空的数据中心计算机“Vera Rubin Space-1”,彻底打开了AI算力向地球之外延伸的想象空间。

回望19世纪的淘金热,卖铲人赚到了最多的钱。但今天的英伟达,远不止是卖铲人。

它通过一系列技术革新和生态建设,让全世界相信:挖金子必须用它的铲子。

在黄仁勋的叙事里,未来的每一家企业——无论是做模型的、做Agent的、造机器人的、开数据中心的——都将成为英伟达“Token工厂”体系中的一个车间。而黄仁勋,站在这个万亿工厂的总控室里,静静看着每一度电、每一枚Token,最终变成它的财报数字。

-END-

相关推荐