5月19日上午,上海前滩香格里拉酒店三层人潮涌动,这场原本规划千人的AMD AI开发者大会,最终涌入了约2000名开发者,会场过道被挤得水泄不通。当AMD董事会主席兼CEO苏姿丰(Lisa Su)博士现身展区时,现场气氛被推向了高潮——年轻的开发者们高举手机,争先恐后地希望与这位被昵称为“苏妈”的半导体行业传奇人物合影交流。
这场盛会不仅是AMD首次在北美之外举办全球级AI开发者大会,更恰逢AMD上海研发中心成立二十周年。然而,比这些数字更具历史意义的是苏姿丰在演讲中释放的一个核心信号:AI算力架构正在经历一场根本性的权力转移,CPU正在重返舞台中央。
一、智能体爆发:AI进入新的转折点
“我必须问一句,你们兴奋吗?”苏姿丰一上台就用这句话点燃了全场。在她看来,这种兴奋是有充分理由的——“我在科技行业已经超过三十年,但从未有过比现在更令人兴奋的时代。”
苏姿丰指出,AI正在经历一个关键的转折点。如果说过去几年人们更多讨论的是大语言模型“问一个问题、得一个答案”的能力,那么现在,智能体AI正彻底改变使用AI的方式。她预测,未来每个人可能拥有5个、10个甚至100个智能体协同工作,这将带来生产力的指数级跃升,AI将无处不在。
这一判断得到了零一万物创始人李开复的呼应。在与苏姿丰的对话中,李开复提出了一个更为犀利的观察:如果说2024年的核心问题是“AI能完成一项任务吗?那么2025年的核心问题是“AI能完成一个完整的工作流吗?2026年的核心问题就是“AI能运营一个企业职能部门吗?”。他断言,多智能体架构将打破单一模型的能力天花板,开启企业AI转型的真正篇章。
Dr. Lisa Su和李开复博士对话 “AI智能体新范式”
“未来二十年的故事,将是一个人指挥数百个智能体协同工作。”AMD高级副总裁、计算与图形总经理Jack Huynh这样描绘着未来的愿景。
二、架构重构:从以GPU为主,到CPU+GPU并重
然而,智能体的爆发不仅仅是应用层面的变革,它正在倒逼底层算力架构进行历史性重构。
苏姿丰在演讲中抛出了一个业界高度关注的数据:传统数据中心里CPU与GPU的配比大约是1:4,但到2026年,这一比例将变成1:1。这一判断意味着,在当前庞大的GPU需求基础上,AI服务器市场将迎来一轮同等量级的CPU需求爆发。
这一转变有着深刻的技术逻辑。在AI训练阶段,GPU承担了绝大部分矩阵运算工作,CPU更多扮演“数据搬运工”的角色。但在智能体时代,工作负载发生了根本变化:
任务编排复杂化:一个智能体任务往往需要拆解为多个子任务,调用不同工具,整合多源信息,这需要强大的CPU进行流程调度和逻辑判断。
推理过程密集化:智能体并非简单的一次性推理,而是需要多轮“思考-行动-观察”循环,每一步都涉及CPU与GPU的频繁交互。
部署边缘化:随着AI向PC、手机、汽车等终端渗透,CPU作为通用计算核心的地位更加凸显。
“当然,每个人都爱GPU。你们想要更多GPU吗?是的!未来会有更多GPU。”苏姿丰在演讲中这样调动现场气氛,随即话锋一转——“但除了GPU,你还需要大量的CPU处理能力,才能真正具备作为一个完整智能体运行的能力。”
AMD高级副总裁、计算与图形总经理Jack Huynh进一步阐释了这一转变的产业意义。他援引小米AI大模型负责人罗福莉的话说:“Agent时代不属于烧掉最多算力的人,而属于用得最聪明的人。 ”未来五年的赢家,不会是租用最多GPU云算时的团队,而是从第一天起就以效率为核心设计系统的团队。
三、AMD:唯一拥有顶级CPU+GPU全栈的玩家
在这一算力架构重构的浪潮中,AMD凭借其独特的战略位置获得了天然优势。
放眼全球芯片行业,AMD是唯一同时拥有顶级服务器CPU(EPYC霄龙)和AI GPU(Instinct加速卡)产品线,并具备统一软件栈(ROCm)的芯片巨头。
英伟达虽然在AI GPU领域占据绝对主导,但它不生产x86服务器CPU;英特尔拥有强大的CPU产品线,其AI GPU业务却仍在苦苦追赶。博通、Marvell等厂商则活跃于定制化ASIC领域,同样无法同时覆盖通用CPU与高性能GPU。
这种“CPU+GPU”双翼齐飞的布局,在智能体时代显得尤为关键。智能体工作负载正在从根本上改变数据中心内部的算力配比——一个典型的智能体任务往往需要频繁地在推理、检索、规划、执行之间切换,天然要求CPU与GPU之间实现极低延迟的数据交换和协同调度。当CPU与GPU来自同一厂商,系统层面的协同优化就有了基础,这正是AMD的差异化优势所在。
从产品和解决方案层面看,AMD构建了完整的AI部署路径,涵盖了开发阶段、规模测试阶段和部署阶段。
开发阶段:Ryzen AI Max系列处理器提供高达128GB的统一内存,让开发者能够在笔记本上本地运行2000亿参数级别的前沿模型。目前市面上已有超过35款搭载该系列处理器的系统,涵盖笔记本电脑、一体机和紧凑型工作站。
规模测试阶段:Radeon AI Pro R9700 GPU搭配Threadripper Pro 9000系列工作站CPU,后者提供128条PCIe 5.0通道,可从单一主机支撑多块GPU协同运行,实现“云级开发能力,本地化控制”。
部署阶段:从数据中心到边缘设备,AMD拥有完整的CPU+GPU产品组合,并提供了统一的ROCm软件栈支持,开发者可实现“一次编写,全路径运行”。
四、中国市场:智能体革命的前沿阵地
苏姿丰在演讲中多次强调中国市场的重要性。她表示,AMD进入中国已超过30年,拥有超过4000名工程师,上海研发中心是其全球最大的研发中心之一。
据介绍,上海研发中心深度参与并主导了多项关键产品的研发、测试验证和量产支持,构建了覆盖芯片设计、系统设计、软硬件协同开发、客户工程以及AI软件与生态建设在内的全栈技术能力。同时,中心持续培养和汇聚大批具备国际视野的高端研发人才,为AMD业务的拓展注入了强劲的技术支撑与创新动能。
“中国是全球最活跃的AI生态系统,”苏姿丰说,“这里最令人兴奋的地方在于,你们正引领着智能体AI和企业级AI的发展。”她特别指出,中国AI生态的突出特征是对开放创新的深刻理解和实践——这种开源精神在全球范围内都具有示范意义。
李开复在与苏姿丰对话中业深入分析了中国开源生态崛起的结构性原因。他指出,由于硬件资源的现实约束,中国开发者无法像美国闭源巨头那样依靠“暴力计算”取胜,因而“出于绝对的必要性,社区找到了一条发挥中国工程效率和协作精神的路径”。
他做了一个生动的比喻:“如果说硅谷的AI巨头像是渴望获得诺贝尔奖的天才,中国的AI生态则更像一个充满活力的去中心化学习小组,大家共同面对考试,相互学习,共同构建。”
在大会现场,AMD展示了与零一万物联合打造的企业智能体一体机Cube01,该设备基于Ryzen AI Max+ 395,采用统一内存架构,可在本地同时运行数百个Agent,实现安全私密的本地化部署。
在场外的展台上,国产存储厂商江波龙也联合极摩客推出了基于AMD锐龙AI Max+ 395平台+江波龙AI存储智能体的解决方案的智能体主机——极摩客EV0-X2。据介绍,这款产品经过深度联合调优,在本地大模型的运行上取得的显著的优化进展。其中,在128GB内存场景下,成功实现397B超大参数AI模型在本地的部署。在64GB内存场景中,不仅能实现122B大模型的本地部署运行,还能顺畅运行80B、122B等中大型模型并提升长上下文场景的表现,通过软件调度的形式,将大模型当中不常用的专家模型卸载到专用的高速AI SSD区块上,有效解决了端侧AI运行中内存使用过高的痛点,大幅提升了端侧AI计算的效率与经济性。
据介绍,在中国,AMD还致力于赋能和培养创新的AI开发者:通过提供基于Radeon GPU的免费开发者云,与基础模型公司深度协作优化基于AMD GPU的训练与推理。目前,AMD ROCm平台已实现对DeepSeek、通义千问、MiniMax、Kimi、阶跃星辰、小米MiMo等国内主流开源大模型的“Day-0”适配支持。
此外,AMD还宣布推出面向中国AI开发者的免费公共AI开发者云,搭载Radeon GPU,并与魔搭社区、阿里云达成深度协作,让开发者能够直接在熟悉的平台上调用AMD GPU算力。
五、展望:50亿人的AI未来
展望未来,苏姿丰给出了一个惊人的预测:目前全球已有超过10亿每日使用AI的用户,到2030年,这一数字将突破50亿。这意味着,AI将像电力一样,成为现代社会的基础设施。
清华大学电子工程系教授、无问芯穹发起人汪玉则在大会上提出了一个更宏大的框架:AI生产力 = 智能规模 × Token效率 × 价值转化。他认为,下一阶段的竞争焦点将从单纯的算力堆砌,转向如何更高效地将算力转化为实际生产力。
苏姿丰最后总结道,AMD的战略聚焦于三个层面:为AI提供最佳算力、构建开放的软件生态系统、将AI带入每一个角落。在她看来,这不仅是AMD的使命,也是整个开发者社区共同的历史机遇。
编辑:芯智讯-浪客剑
168