本文来自“2025~2026 OCP/FMS/ISSCC/ODCC/HotChips全球峰会合集”,资料已上传至“智能计算芯知识”星球,登录可下载获取97个专栏资料合集。
AI 圈内存涨了6 倍、H100 租金暴涨 40%,硬件商都在喊 “赚麻了”,但真正闷声发大财的,是 Anthropic 这帮模型厂商 ——ARR 直接从 90 亿干到 440 亿美元,毛利率从 38% 干到 70%+,把英伟达、台积电都看傻了眼。
一、先看魔幻现实:AI的钱,已不按去年的分法了
放在2023-2025 年,谁是 AI 爹?英伟达+ 电力厂 + 内存厂,吃肉吃到撑。英伟达财报一发涨25%;2024 年电力股 Vistra 涨 265%;2025 年美光、西部数据统统涨超 200%。
那时候模型厂啥样?毛利率低到没法看,天天烧卡换增长,外人还嘲讽:“AI 除了聊天画画,还能干啥?”
结果2025 年底Agent 智能体一落地,直接掀桌子:
以前要几十工时、几千美元的活,现在几美元token 搞定
分析师天天用AI 做报表、跑模型、画图表,人效直接起飞
企业真金白银砸钱,Anthropic 年化收入直接干到440 亿美元
推理毛利率38%→70%+,从“苦哈哈代工厂” 变 “印钞机”
现在格局彻底变了:终端爽、模型厂赚爆、云厂喝汤、硬件商原地发呆。
二、硬件这边:涨价涨到手软,为啥还是配角?
先感受下硬件圈的疯狂:
DRAM 内存:一年暴涨6 倍,产能利用率干到90%+,有钱都拿不到货
H100 租金:一年合约价比2025 年 10 月低点暴涨40%,上架就秒没
台积电3nm:2026 下半年产能利用率超100%,全被AI 芯片包场
看着赚翻对不对?错!真正的大头根本不在这。
因为新一代芯片性能涨得比价格快太多:
Blackwell 跑 Agent,token 吞吐量是 Hopper 的30 倍
软件优化一叠加,同一张卡吞吐量能翻14 倍
推理成本直接断崖式下跌,毛利率全送给模型厂
英伟达、台积电更憋屈:明明卡脖子、产能拉满,居然没跟着涨价!黄仁勋还在搞“普惠算力”,台积电也稳如老狗不抬价,等于把万亿价值白送给下游。
一句话总结:硬件在涨价,但模型厂靠效率爆炸,赚走了更大的蛋糕。
三、重头戏:Anthropic 凭啥半年翻 5 倍,毛利率干到 70%+?
很多人还以为大模型公司“烧钱换增长”,早过时了。
Anthropic 这波封神,核心就三招:
1、Agent 把 token 价值拉满
输入输出比干到300:1,缓存命中率超90%,实际成本低到离谱标称很贵,真实综合价只要0.99 美元 / 百万 token,企业疯买
2、硬件代际飞跃+ 软件极致优化
Blackwell 一上,配合解耦、MTP 多令牌并行,吞吐量直接起飞同样一台机器,跑的 token 多几倍,成本直接砍半再砍半
3、产品结构往上打,越卖越贵
Opus 降价了,但大家都买更贵的 Opus Fast、Mythos最贵的型号输入25、输出 125 美元 / 百万 token,毛利率高到吓人企业还抢着买:生产力提升比那点钱值钱太多。
结果就是:降价→量暴增→结构升级→毛利率反升商业闭环完美到离谱。
四、英伟达大招藏在后头:Rubin+SOCAMM,要收割最后一块肥肉
英伟达不是傻,是在憋大招。新一代Vera Rubin VR NVL72,直接改游戏规则。
最狠的一招:SOCAMM 模块化内存以前内存焊在板上,没法单独收钱;现在做成可插拔模块,内存单独定价、单独收割。
2026Q1 英伟达拿货价8 美元 / GB
年底预计干到13 美元 / GB
转手卖给客户,毛利率轻轻松松60%+
关键是:客户还不得不买。因为Rubin 性能太强,单位 TCO 吊打一切,多花的钱能从 token 成本里赚回来。
更狠的是:
成本定价:租赁4.92 美元 / 小时就能回本
价值定价:天花板能摸到12.25 美元 / 小时中间差了快3 倍,全是英伟达的提价空间
业内一句话:英伟达现在是AI 世界的中央银行,放水养肥全场,等时机一到,直接收税。
模型厂商赚爆(Anthropic 带头)ARR 从90亿→440 亿,毛利率 38%→70%+,AI 价值第一赢家
英伟达即将赚爆(Rubin+SOCAMM)不提价是给面子,一提价就是40% 空间,吃肉还在后头
内存厂赚麻,DRAM 涨 6 倍,HBM 一卡难求,躺着数钱
喝汤:新云厂商/ 算力租赁赚点辛苦钱,上下都被夹着
佛系:台积电产能爆满却不涨价,战略放利润,稳字当头
最惨:跟风炒卡、没 top 模型的小厂硬件涨价、成本飙升,竞争力被打爆,彻底出局
五、总结:AI 价值池已经彻底换庄
以前AI 的钱:算力→硬件→产能→英伟达吃肉
现在AI 的钱:Agent→token 价值爆炸→模型厂狂赚→英伟达憋大招收割
这一轮大转移,说白了就三句话:
1.智能体AI,把 token 从 “成本” 变成 “黄金”
2.模型厂第一次拿走行业最大份利润,彻底站起来
3.英伟达、台积电手握卡脖子产能,却在“刻意让利”,大招还没放
后面会发生啥?
模型厂继续涨价/扩毛利,英伟达Rubin 上市后,悄悄提价40%+;内存继续涨,硬件继续缺,没顶级模型的中小厂,批量出局
AI 的捞金时代,才刚刚进入最猛的阶段。
338