• 正文
  • 相关推荐
申请入驻 产业图谱

强强联手,SSD或将迎来重大变革

20小时前
213
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

AI大模型的爆发式增长,让SSD重要性日益凸显——海量参数的存储与快速读取直接决定了推理和训练效率。然而,AI负载对SSD的性能、耐久性、散热和并发访问能力提出了远高于传统场景的苛刻要求。

为此,SSD技术不断加速迭代,从闪存介质到控制器架构都在寻求突破。近期,英伟达联手亚马逊,从存储链路底层入手,推出GPU直控SSD等新一代技术方案,试图重新定义AI时代的存储规则。

一、英伟达联手亚马逊,GPU将直接控制SSD?

媒体报道,英伟达与亚马逊两家公司正在推进一项名为GIDS(GPU发起直接存储访问)的技术,并计划在其下一代Vera Rubin AI平台中导入该方案。

GIDS技术的核心在于允许GPU直接向SSD或高速闪存发出存储访问指令,全程绕过CPU和DRAM。在传统冯·诺依曼架构中,数据从SSD传输至GPU需经历“SSD→DRAM→GPU”四级路径。CPU作为调度中枢,负责解析存储指令并搬运数据,DRAM则充当临时缓存。这一多级中转机制带来了上下文切换开销、内存拷贝延迟以及总线争用问题,成为大规模AI模型训练与推理中的一大瓶颈。

GIDS技术直接移除CPU与DRAM的中间角色,将数据路径压缩为“SSD→GPU”单级链路。从技术意义上看,这一变革可降低数据访问延迟,释放CPU算力用于其他计算任务,同时减少对DRAM容量的依赖,使GPU能够更高效地处理超出本地显存范围的大规模参数集。

GIDS的实现依赖于多项底层技术:首先是CXL(Compute Express Link)协议,具体为CXL 3.0版本。通过CXL的内存语义(CXL.mem),GPU可以将SSD的存储空间映射为自身地址空间的一部分,进而使用load/store指令直接访问SSD上的数据,无需经过块设备驱动栈。这种内存级访问方式与GPU访问本地HBM(高带宽内存)在指令层面保持一致。

其次是物理传输层,需要PCIe 6.0或7.0支持(例如PCIe 7.0 x16单向链路带宽可达256GB/s),为大规模数据直接传输提供必要带宽。此外,SSD控制器必须原生支持CXL协议,能够解析来自GPU的内存语义请求,并返回对应的数据负载。目前,多家存储控制器厂商已开始研发支持CXL的SSD主控芯片

二、AI负载下的SSD:高压挑战与新兴机遇

AI工作负载对SSD提出了极端的技术要求,在GPU直接控制SSD的架构下,这些要求变得更加突出,具体体现在以下方面。

性能需求升级。AI推理场景中,GPU需要频繁执行小粒度随机读操作,典型块大小为512字节至4KB,且集群级每秒需支持数百万乃至上亿次 IOPS。这对SSD控制器内部的队列深度、FTL(闪存转换层)映射效率以及闪存介质的读取延迟提出了远超传统数据库负载的标准。

耐久性要求提高。AI推理中的KV缓存等写入模式具有高频、小粒度覆盖写的特征,导致SSD的每日全盘写入次数(DWPD)成数量级上升。为满足这一耐久性,厂商需采用pSLC(伪单层单元)或pMLC(伪多层单元)闪存模式,或者大幅增加超额配置(Over-Provisioning)比例。

散热与功耗约束。超高IOPS运行使SSD主控与闪存芯片的功耗显著上升,传统风冷方案难以有效带走热量。液冷技术成为必要选择,但目前液冷接口标准尚未统一,改造成本较高。

多发起者数据一致性与隔离。在AI集群中,多个GPU节点可能同时访问同一块SSD上的不同数据区域。SSD需要支持直接的、文件系统感知的数据访问机制,并提供LBA范围租约(Range Lease)以及多租户数据隔离保护,防止不同任务的访问冲突。

容量与成本的平衡。QLC闪存虽然提供较高的存储密度和较低的每GB成本,但其写入寿命和读取性能较低。如何在满足AI大容量需求的同时不显著牺牲随机读性能,是SSD厂商需要解决的工程问题。

尽管存在上述挑战,AI负载也为SSD产业创造了新的市场机会。

AI专用SSD产品线扩张。针对AI工作负载中的静态参数加载、KV缓存、检查点保存等不同场景,存储厂商可开发超高IOPS型、KV优化型、归档型等差异化SSD产品,抢占细分市场。

存算一体技术落地。将部分计算任务(如向量检索、数据量化、无损压缩)下沉至SSD内部,利用SSD主控中的轻量计算单元完成,可以减少数据搬移量,降低PCIe带宽占用,并提升端到端处理效率。这一技术路径被称为计算型存储(Computational Storage)。

边缘AI存储需求增长。智能摄像头自动驾驶车辆、工业机器人等边缘设备需要本地存储支持AI模型运行。SSD相比eMMC或UFS在延迟、可靠性和容量上具有优势,正成为边缘AI存储的首选方案。

AI芯片厂商的深度合作。英伟达提出的Storage-Next架构即以GPU而非CPU作为存储引擎。该架构通过优化NAND闪存及控制器设计,目标是使SSD的随机读取性能大幅上升,推动系统设计从“以DRAM为中心”向“SSD感知”(SSD-conscious)转变。存储厂商通过与英伟达等AI芯片公司建立联合研发,可深度嵌入AI生态,提升自身在标准制定和产品定义中的话语权。

综上,AI负载对SSD施加了多维度的技术压力,同时也为存储产业开辟了从器件、控制器到系统架构的全层次创新空间。

结 语

英伟达等厂商在存储领域的最新探索,体现了计算与存储走向深度协同的趋势。对于SSD产业而言,AI既是技术极限的试金石,也是产品创新与市场重构的重要驱动力。架构设计、介质工艺、系统适配等关键环节的持续创新,将成为SSD产业在AI时代发展路径中的重要变量。

相关推荐

登录即可解锁
  • 海量技术文章
  • 设计资源下载
  • 产业链客户资源
  • 写文章/发需求
立即登录

DRAMeXchange(全球半导体观察)官方订阅号,专注于半导体晶圆代工、IC设计、IC封测、DRAM、NAND Flash、SSD、移动装置、PC相关零组件等产业,致力于提供半导体产业资讯、行情报价、市场趋势、产业数据、研究报告等。