AI 时代,内存和处理器不能再分家,必须靠先进封装把它们越贴越近、越叠越密。三星从MOP、HBM这种成熟方案,到PIM、3D HBM下一代技术,再到移动端、服务器端全套封装平台全都布局完,就为了解决 AI 的内存墙、功耗墙问题。
芯科技圈读文后发现,三星VLSI 这篇报告核心就一件事:AI 大模型把传统内存和处理器的 “距离问题” 逼到极限,必须靠 “把内存和计算芯片贴得更近、焊在一块” 的共封装 和 共集成技术破局,三星已经把全套方案都铺好了。
一、内存现在的核心痛点在哪里?
AI 大模型太吃内存大模型参数到万亿级,生成内容时算力够用、内存带宽跟不上,变成 “内存墙”,系统性能被内存卡死。
数据搬移太费电、太贵内存和处理器离得远,数据来回跑的功耗,比内存本身工作的功耗还高,能效完全跟不上。
计算快、内存慢,差距越来越大处理器性能涨得快,内存带宽和能效进步慢,不贴一起根本没法用。
二、现在能用的成熟方案:先把内存 “搬近点”
1. MOP(封装内集成内存)
把内存直接做在处理器封装里,线更短、针脚更密。
信号完整性提升 73%,PHY 接口功耗大减,简单高效。
2. HBM(高带宽内存,AI 主力)
用 TSV 硅通孔堆叠多颗内存裸片,IO 口极多、带宽炸高。
HBM3E 带宽能到1TB/s,是 DDR5 的几百倍,专门喂饱 AI 算力。
三星已经量产 12 层堆叠 HBM3,16 层样品也做好了。
三、未来下一代技术:再近一步,直接 “内存里算”
1. PIM(存内计算)
不在处理器算,把简单计算单元放进内存里就地算。
带宽提升最高 8 倍,数据不用来回搬,功耗大降,特别适合生成式 AI。
唯一卡点:需要配套成熟软件栈才能用好。
2. 定制 HBM + 3D HBM
定制 HBM:改内存底层架构,优化整机性能和成本。
3D HBM:把计算和内存垂直 3D 叠一起,面积缩一半、带宽提 10 倍。
难点:散热要重做,未来 HBM4 会用铜混合键合(HCB)解决。
四、三星的全套封装 “工具箱”
HBM 核心工艺TCB(热压键合)已量产,HCB(铜混合键合)研发中,更密、更薄、散热更好。
2.xD 封装平台(I-Cube 系列)高中低端全覆盖,能用硅中介层、硅桥,成本和性能平衡,能一颗封装塞 12 颗 HBM。
移动端 AI 方案扇出型封装(FOWLP)双面布线,给手机 AP+LPDDR 做高集成,轻薄还高能效。
CPO(共封装光学)给交换机 - GPU、逻辑 - HBM 做光互联,2028 年单口带宽冲到 12.8Tbps。
文章篇幅有限,完整报告50页已上传到芯科技圈知识星球。欢迎加入学习~
478
