• 正文
  • 相关推荐
申请入驻 产业图谱

CPU重回焦点位

3小时前
213
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

为期三天的台北国际电脑展(COMPUTEX)落幕。

在智能体应用的推动下,今年的COMPUTEX受到了比以往更多的关注。

而在这场活动上唱“重头戏”的几大芯片巨头,不约而同地把CPU托举到了焦点位。

CPU,成为智能体时代芯片厂商争夺的关键。

英伟达发布的Vera CPU

四家公司,同一个信号

6月1日,英伟达GTC台北大会召开。会上,英伟达创始人兼首席执行官黄仁勋重磅发布Vera CPU——首款专为智能体打造的CPU。黄仁勋说:"AI智能体将成为计算资源的最大用户,而Vera正是专为在超大规模基础设施中运行智能体AI而生。"

同一天,高通CEO安蒙在COMPUTEX开幕主题演讲中,将2026年定义为“智能体之年”。他明确指出:“你需要一个非常强大且高能效的CPU来负责任务的编排规划。”

英特尔发布志强6+处理器

6月2日,英特尔CEO陈立武在COMPUTEX主题演讲中发布了至强6+处理器。这是基于Intel 18A制程的首款数据中心CPU,搭载288颗能效核。

6月3日,Arm宣布Oracle Cloud Infrastructure加入其AGI CPU生态系统。Arm云AI事业部执行副总裁Mohamed Awad在博客中提到:在3月24日举办的Arm Everywhere活动上,Arm曾指出,智能体AI将大幅提升数据中心对于CPU的需求。短短两个月后,市场发展速度已超出Arm的预期。

短短几天,四家全球芯片头部企业释放出同一个信号:CPU的作用不容小觑。

CPU“重量级”回升,为什么?

答案藏在智能体的工作方式里。

传统的AI推理是"一问一答"模式:用户输入一个问题,模型输出一个答案。在这个过程中,GPU负责繁重的矩阵运算,CPU只需要做一些简单的数据搬运和调度工作。所以CPU:GPU的配比可以做到1:8甚至更高——GPU是主角,CPU是配角。

但智能体不是这样工作的。

智能体需要"自己跑代码、进沙盒验证、疯狂调用外部工具"。具体来说,一个智能体完成一个任务,可能需要经历一个漫长的过程:

理解用户意图,分解任务为多个子任务,为每个子任务选择合适的工具,调用工具并执行代码,评估执行结果,若结果不满意则重新调整策略,最终输出结果。

这一工作流中,CPU要承担相当比重的负载。行业研究机构SemiAnalysis近期测算发现,在现代智能体代码工作负载中,约42%的执行时间被以CPU驱动的工具调用。

黄仁勋表示传统CPU吞吐量跟不上GPU需求

为什么智能体(Agent)对CPU的要求如此苛刻?在英伟达GTC台北大会的演讲中,黄仁勋解释了原因:“Agent没有耐心,它们生活在纳秒级的世界里。当它使用工具时,它希望响应时间尽可能快。当Agent访问数据库时,它也要求数据尽快返回。在这条路径上,CPU如果效率不够高,将阻止Agent执行下一步。”

因此,智能体时代,CPU是GPU利用率的瓶颈,直接影响Token吞吐量、延迟和用户体验。所以,智能体CPU要尽可能降低延迟,尽可能具有交互性。

而实现这一目标最简单的做法便是提高CPU在计算系统中的占比。Creative Strategies首席执行官兼首席分析师Ben Bajarin指出:"在模型训练时代,AI部署中CPU与GPU的配比大致接近1:4,而智能体推理则将这一比例改写为接近1:1(甚至GPU占比更低)。"

四家CPU,四种打法

理解了CPU为什么重要,再来看看面对新的竞争格局,四家公司各自的产品策略。

英伟达Vera:专为智能体定制

Vera的核心卖点是"专为智能体打造"。它搭载了88个Olympus核心,空间多线程技术,以及带宽高达1.2TB/s的LPDDR5X内存子系统。这些特性能够帮助智能体大幅减少在CPU步骤上的等待时间,从而让AI工厂里的加速器始终保持高速运转,任务完成速度比传统x86 CPU快1.8倍。

OpenAI、Anthropic、SpaceXAI等全球顶级AI实验室,以及字节跳动、CoreWeave、甲骨文等云巨头,都已计划采用Vera。戴尔、HPE、联想、Supermicro等OEM厂商也将推出搭载Vera的独立CPU服务器

Arm AGI CPU:能效比的武器

英伟达合作伙伴——Arm的策略是打能效牌,称其专为智能体AI打造的AGI CPU的单机架级性能可达传统x86 CPU的两倍以上,使云服务提供商与AI基础设施运营商能够在功耗和散热约束范围内,大幅提升计算密度。

在三月份的Arm Everywhere活动上,Arm曾预计,每部署一吉瓦AI基础设施,Arm AGI CPU可为运营商节省高达100亿美元的资本支出。而在最近的技术博客中,Arm表示随着智能体AI的加速普及,它能够带来的经济效益将更为巨大。

英特尔至强6+:存量市场的反击

英特尔的路线,是在x86的基础上做极致优化。COMPUTEX上发布的至强6+是基于Intel 18A打造的首颗数据中心CPU,搭载288颗能效核,配备576MB L3缓存,可用于机架级AI基础设施,以极高密度承载多智能体运行。

陈立武的逻辑是:x86架构统治数据中心五十年,存量客户不会轻易换架构。英特尔要做的,是让x86在智能体时代依然能打。

基于这一思路,英特尔联合SambaNova和富士康,推出了机架级AI基础设施。这个方案将英特尔至强处理器与SambaNova SN-50 RDU(可重构数据流单元)紧密结合,专门用于AI推理。

英特尔还与富士康、西门子、日立、Echo Neurotechnologies 和Greenstone Biosciences 等行业领导者展开战略合作,聚焦提供基于英特尔处理器和定制芯片的垂直行业整合解决方案。

高通Dragonfly:以端云协同为核心

高通的打法与前三家不同。安蒙在演讲中强调的是“端云协同”——智能体AI不是只在云端运行,也不是只在终端运行,而是两者协同。他举了一个例子:在编程场景中,采用分布式智能体AI架构,可节省约140万token,成本降低60%。

为此,高通在COMPUTEX上发布了数据中心业务新品牌Dragonfly(高通飞龙),正式进军数据中心市场。安蒙表示,高通的产品组合已覆盖“计算连续体”的各个层级——从可连接智能体的最小的可穿戴设备,到高性能的数据中心。

CPU的竞争格局正在重构

安蒙在演讲中还揭示了Token消耗量的“三级跳”:第一阶段是对话式AI,单次交互约消耗1万token;第二阶段是推理式AI,每项任务约需10万token;第三阶段是智能体AI,单任务token用量达到100万且在持续增长。短短两代演进,token消耗已实现约100倍的量级增长。

这意味着,算力基础设施未来的市场增长空间不可限量,也意味着,原本已经定型的市场格局极有可能被颠覆——英特尔与AMD长久以来在数据中心CPU领域的霸主地位,可能面临易主。

而要在新一轮竞争中获胜,具备如下条件的CPU将更有优势:

其一,高能效比。数据中心的电费和散热是硬约束。在同等性能下,功耗越低的CPU越有竞争力。

其二,与GPU的协同能力。智能体时代需要CPU+GPU异构计算的协同配合,两者之间的数据传输效率至关重要。


作者丨姬晓婷
编辑丨吴丽琳美编丨马利亚监制丨赵晨

相关推荐