• 正文
  • 相关推荐
申请入驻 产业图谱

Agentic AI时代:CPU与GPU比例将从1:8到1:1甚至4:1!

1小时前
351
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

一、从“GPU独大”向“CPU+GPU协同”转变AI Agent驱动CPU范式转移,从配套配角到核心主力,配比、需求、价格、产业格局全面重构。Intel、AMD英伟达、谷歌等巨头均确认配比趋势,英伟达 VeraCPU与RubinGPU采用1:2配比,谷歌TPU V8与CPU为1:2,Intel CEO陈立武预判未来将走向1:1均衡,甚至可达4:1。Intel 陈立武:随着AI从训练转向推理,在AI时代日益重要且不可或缺,CPU与GPU的配置比例从1:8向1:1靠拢,甚至可达4:1。AMD 苏姿丰:AI当前正处于转折点,推理与智能体AI的发展带来计算需求的转变,催⽣CPU新定位。当前正进入“CPU+GPU”时代,传统数据中心里CPU与GPU⽐例是1:4,到2026年将变成1:1。NVIDIA 黄仁勋:我们正迈入推理时代,CPU必须与GPU协同优化,以适配推理与智能体工作负载的复杂调度需求,VeraCPU与Rubin GPU采用1:2配比,核心目的是实现系统级算力均衡。

二、从“龙套”到“主角”,Agentic AI中CPU工作负载的变化训练时代(2022-2024):核心任务是大模型训练,工作流线性单一。GPU承载90%以上工作负载,进行矩阵运算与Token生成等,而CPU仅负责数据加载、简单前后处理,妥妥的龙腾角色。CPU与GPU配比为1:4或1:8。Agentic AI(智能体)时代:核心任务更复杂,ReAct循环闭环:规划→工具调用→执行→结果解析→反思→多轮推理迭代。CPU承担40%~80%端到端工作负载,成为系统调度、控制、执行的核心,而GPU仅负责纯大模型前向推理/解码,占总耗时仅20%~60%。CPU与GPU配比反转:1块GPU匹配1~2颗高性能CPU(80~120 CPU核心),CPU资源配置比例持续走高。
为什么Agentic AI时代CPU越来越重要?1、长上下文KV Cache卸载,CPU承接海量“记忆内存”2、工作流从“单次计算”变为“无限循环调度+外部执行”

3、多智能体(Multi-Agent)架构带来指数级CPU调度压力

4、CPU“天生”比GPU架构更适合Agent的分支、IO、沙盒任务

5、推理规模远超训练,推理场景天然CPU高配比

三、AI Agent广泛应用引爆Token需求,带动AI服务器需求激增伴随Open Claw与Hermes广泛应用,Token需求量呈几何级数增长,2025年Token消耗量平均每周100亿,进入2026年Token销量每日破百亿,到了2026年3月豆包大模型单日Token消耗量超百亿。Token经济的飞速发展推动算力需求激增,2025年全球AI服务器出货量约210万台,预计到2030年全球AI服务器需求突破500万台,五年CAGR 14.4%。
四、服务器CPU市场规模破千亿美元到2030年,按照CPU与GPU比例1:1进行计算,服务器CPU用量(包括机柜内与机柜外)将超过5000万颗,对应市场规模达到1500亿美元以上。
步入Agent AI时代,CPU重要性凸显,其已然成为决定AI推理能力的关键。面对X86、ARM、RISC-V三条技术路线,谁是最佳选择?巨头们用行动给出答案!英伟达、高通、亚马逊、META纷纷加码RISC-V布局,奕斯伟计算、阿里达摩院、北京开源芯片研究院等中国厂商正在加速推进RISC-V在Agentic AI方向的解决方案落地。属于RISC-V的黄金时代已然到来,Agent AI浪潮,正是RISC-V实现全面爆发的绝佳契机!

相关推荐