CPU重回焦点位

为期三天的台北国际电脑展（COMPUTEX）落幕。

在智能体应用的推动下，今年的COMPUTEX受到了比以往更多的关注。

而在这场活动上唱“重头戏”的几大芯片巨头，不约而同地把CPU托举到了焦点位。

CPU，成为智能体时代芯片厂商争夺的关键。

英伟达发布的Vera CPU

四家公司，同一个信号

6月1日，英伟达GTC台北大会召开。会上，英伟达创始人兼首席执行官黄仁勋重磅发布Vera CPU——首款专为智能体打造的CPU。黄仁勋说："AI智能体将成为计算资源的最大用户，而Vera正是专为在超大规模基础设施中运行智能体AI而生。"

同一天，高通CEO安蒙在COMPUTEX开幕主题演讲中，将2026年定义为“智能体之年”。他明确指出：“你需要一个非常强大且高能效的CPU来负责任务的编排规划。”

英特尔发布志强6+处理器

6月2日，英特尔CEO陈立武在COMPUTEX主题演讲中发布了至强6+处理器。这是基于Intel 18A制程的首款数据中心CPU，搭载288颗能效核。

6月3日，Arm宣布Oracle Cloud Infrastructure加入其AGI CPU生态系统。Arm云AI事业部执行副总裁Mohamed Awad在博客中提到：在3月24日举办的Arm Everywhere活动上，Arm曾指出，智能体AI将大幅提升数据中心对于CPU的需求。短短两个月后，市场发展速度已超出Arm的预期。

短短几天，四家全球芯片头部企业释放出同一个信号：CPU的作用不容小觑。

CPU“重量级”回升，为什么？

答案藏在智能体的工作方式里。

传统的AI推理是"一问一答"模式：用户输入一个问题，模型输出一个答案。在这个过程中，GPU负责繁重的矩阵运算，CPU只需要做一些简单的数据搬运和调度工作。所以CPU:GPU的配比可以做到1:8甚至更高——GPU是主角，CPU是配角。

但智能体不是这样工作的。

智能体需要"自己跑代码、进沙盒验证、疯狂调用外部工具"。具体来说，一个智能体完成一个任务，可能需要经历一个漫长的过程：

理解用户意图，分解任务为多个子任务，为每个子任务选择合适的工具，调用工具并执行代码，评估执行结果，若结果不满意则重新调整策略，最终输出结果。

这一工作流中，CPU要承担相当比重的负载。行业研究机构SemiAnalysis近期测算发现，在现代智能体代码工作负载中，约42%的执行时间被以CPU驱动的工具调用。

黄仁勋表示传统CPU吞吐量跟不上GPU需求

为什么智能体（Agent）对CPU的要求如此苛刻？在英伟达GTC台北大会的演讲中，黄仁勋解释了原因：“Agent没有耐心，它们生活在纳秒级的世界里。当它使用工具时，它希望响应时间尽可能快。当Agent访问数据库时，它也要求数据尽快返回。在这条路径上，CPU如果效率不够高，将阻止Agent执行下一步。”

因此，智能体时代，CPU是GPU利用率的瓶颈，直接影响Token吞吐量、延迟和用户体验。所以，智能体CPU要尽可能降低延迟，尽可能具有交互性。

而实现这一目标最简单的做法便是提高CPU在计算系统中的占比。Creative Strategies首席执行官兼首席分析师Ben Bajarin指出："在模型训练时代，AI部署中CPU与GPU的配比大致接近1:4，而智能体推理则将这一比例改写为接近1:1（甚至GPU占比更低）。"

四家CPU，四种打法

理解了CPU为什么重要，再来看看面对新的竞争格局，四家公司各自的产品策略。

英伟达Vera：专为智能体定制

Vera的核心卖点是"专为智能体打造"。它搭载了88个Olympus核心，空间多线程技术，以及带宽高达1.2TB/s的LPDDR5X内存子系统。这些特性能够帮助智能体大幅减少在CPU步骤上的等待时间，从而让AI工厂里的加速器始终保持高速运转，任务完成速度比传统x86 CPU快1.8倍。

OpenAI、Anthropic、SpaceXAI等全球顶级AI实验室，以及字节跳动、CoreWeave、甲骨文等云巨头，都已计划采用Vera。戴尔、HPE、联想、Supermicro等OEM厂商也将推出搭载Vera的独立CPU服务器。

Arm AGI CPU：能效比的武器

英伟达合作伙伴——Arm的策略是打能效牌，称其专为智能体AI打造的AGI CPU的单机架级性能可达传统x86 CPU的两倍以上，使云服务提供商与AI基础设施运营商能够在功耗和散热约束范围内，大幅提升计算密度。

在三月份的Arm Everywhere活动上，Arm曾预计，每部署一吉瓦AI基础设施，Arm AGI CPU可为运营商节省高达100亿美元的资本支出。而在最近的技术博客中，Arm表示随着智能体AI的加速普及，它能够带来的经济效益将更为巨大。

英特尔至强6+：存量市场的反击

英特尔的路线，是在x86的基础上做极致优化。COMPUTEX上发布的至强6+是基于Intel 18A打造的首颗数据中心CPU，搭载288颗能效核，配备576MB L3缓存，可用于机架级AI基础设施，以极高密度承载多智能体运行。

陈立武的逻辑是：x86架构统治数据中心五十年，存量客户不会轻易换架构。英特尔要做的，是让x86在智能体时代依然能打。

基于这一思路，英特尔联合SambaNova和富士康，推出了机架级AI基础设施。这个方案将英特尔至强处理器与SambaNova SN-50 RDU（可重构数据流单元）紧密结合，专门用于AI推理。

英特尔还与富士康、西门子、日立、Echo Neurotechnologies 和Greenstone Biosciences 等行业领导者展开战略合作，聚焦提供基于英特尔处理器和定制芯片的垂直行业整合解决方案。

高通Dragonfly：以端云协同为核心

高通的打法与前三家不同。安蒙在演讲中强调的是“端云协同”——智能体AI不是只在云端运行，也不是只在终端运行，而是两者协同。他举了一个例子：在编程场景中，采用分布式智能体AI架构，可节省约140万token，成本降低60%。

为此，高通在COMPUTEX上发布了数据中心业务新品牌Dragonfly（高通飞龙），正式进军数据中心市场。安蒙表示，高通的产品组合已覆盖“计算连续体”的各个层级——从可连接智能体的最小的可穿戴设备，到高性能的数据中心。

CPU的竞争格局正在重构

安蒙在演讲中还揭示了Token消耗量的“三级跳”：第一阶段是对话式AI，单次交互约消耗1万token；第二阶段是推理式AI，每项任务约需10万token；第三阶段是智能体AI，单任务token用量达到100万且在持续增长。短短两代演进，token消耗已实现约100倍的量级增长。

这意味着，算力基础设施未来的市场增长空间不可限量，也意味着，原本已经定型的市场格局极有可能被颠覆——英特尔与AMD长久以来在数据中心CPU领域的霸主地位，可能面临易主。

而要在新一轮竞争中获胜，具备如下条件的CPU将更有优势：

其一，高能效比。数据中心的电费和散热是硬约束。在同等性能下，功耗越低的CPU越有竞争力。

其二，与GPU的协同能力。智能体时代需要CPU+GPU异构计算的协同配合，两者之间的数据传输效率至关重要。

作者丨姬晓婷
编辑丨吴丽琳美编丨马利亚监制丨赵晨