• 正文
  • 相关推荐
申请入驻 产业图谱

西部数据:以HDD为锚,重构AI时代的数据系统

4小时前
71
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论
AI的规模化落地,瓶颈不仅在于算力,更在于如何管理并存储爆发式增长的数据。AI基础设施本质上是一个数据系统”——从训练、推理到Agentic AI与Physical AI,每种工作负载都在持续生产并累积数据,而这些数据中的绝大部分,仍将长期栖息于HDD之上……

人工智能的全面渗透,不仅带来了算力需求的爆发,更揭示了一个被长期忽视的底层事实:AI不仅是模型的训练与推理,更是一个持续生成、沉淀与再利用的数据系统

西部数据首席产品官Ahmed Shihab在日前于深圳举办的客户创新日上指出,训练单个模型所消耗的数据规模已达数个EB(Exabytes),且世界上存在无数个并行训练的模型;而当模型进入推理阶段,每一次Token的生成都会产生新的数据,这些数据不会流失,而是回流至下一轮训练之中。“尽管计算资源可以在训练和推理之间循环复用,但数据的规模却在无休止地膨胀。”

据IDC预测,到2029年,全球AI基础设施支出预计将突破1万亿美元,2025年至2029年CAGR约为31%[1];Fortune Business Insights数据显示,中国市场同期CAGR达到32.5%[2]。在这一背景下,存储正从“幕后配角”走向前台——IDC数据显示,到2029年,近80%的云端存储仍将基于机械硬盘(HDD)[3]。专注于HDD业务的西部数据,正以“AI驱动型数据经济的存储基础设施合作伙伴”这一定位,试图回答:当数据成为AI的“燃料”,HDD如何以创新而非守旧的姿态支撑这个时代?

从深圳工厂到100TB路线图一场跨越数十年的技术整合

西部数据成立于1970年,最初是一家独立的半导体及芯片制造商,此后凭借对存储技术的持续自主研发与产业整合,逐步成长为全球领先的HDD厂商。而在HDD技术谱系的另一端,IBM作为硬盘驱动器的发明者,其硬盘业务部门于2003年被剥离并出售给日立集团(Hitachi)。2012年,西部数据宣布完成对日立环球存储科技(HGST)的收购,通过这次并购,当年IBM硬盘部门留下的部分核心技术与资产最终并入西部数据版图。这一横跨数十年的产业整合,最终汇聚成今日西部数据以HDD为核心的技术版图。

西部数据深圳工厂

本次客户创新日的首个环节,便是由西部数据制造工程副总裁魏瑾带队,邀请媒体走进西部数据深圳工厂。这座拥有超过20年制造经验的工厂,于2012年正式融入西部数据全球制造网络,并在2019年起持续支持先进HDD制造能力的发展,包括与ePMR(能量辅助垂直磁记录)相关的工艺。结合西部数据的全球运营标准与本地制造专长,深圳工厂具备稳定一致的交付质量、规模化制造能力和高效的运营模式,连续多年获评深圳工业百强企业,并在可持续发展方面荣获节水及绿色发展相关奖项,多次获得深圳市"优秀外商投资企业"称号。

"深圳工厂体现了西部数据对中国及更广泛地区市场的长期承诺。"从魏瑾的讲解中可以看出,这座工厂不仅是产能的支点,更是技术落地的关键一环——它支撑着西部数据更广泛的大容量 HDD 产品矩阵,包括搭载 UltraSMR 与 OptiNAND 等技术的产品,以满足更高容量和更复杂的数据存储需求。

在本次活动上,西部数据勾勒出了其面向AI时代的存储蓝图:2026年重新定位为AI驱动型数据经济的存储基础设施合作伙伴,并发布100TB+ HDD路线图。具体而言,实现全球容量新高的40TB UltraSMR ePMR HDD已进入客户认证阶段;HAMR HDD容量则迈向100TB+,并持续推进与超大规模客户的HAMR技术认证;ePMR与HAMR两种技术路径将并行发展,为客户提供多样化选择与平滑过渡。此外,西部数据还展示了三大技术创新:高带宽硬盘技术(High Bandwidth Drive Technology)、双枢轴技术(Dual Pivot Technology),以及可降低20%功耗的功耗优化型HDD,辅以重新定义存储经济效益的智能平台解决方案

技术路线图加速保障客户业务发展连续性

"客户的发展速度极快,因此当我们发明新技术时,需要确保在导入该功能时不会中断客户的业务。"Ahmed Shihab转述的客户诉求,直接塑造了西部数据的产品路线图。在AI数据呈指数级增长的当下,客户需要的不仅是更高的容量,更是业务连续性技术可预测性

为此,西部数据采取了ePMR与HAMR交叠部署的双路径策略。搭载ePMR技术的硬盘已出货十年,是目前全球主要的存储载体之一;而正处于应用初期的HAMR技术,其产品已交付到客户手中进行技术认证。这种组合意味着,客户可以自主选择在何时、以何种节奏进行技术切换,从而确保业务不受干扰。

在容量跃升的路径上,HAMR技术扮演着关键角色。其原理是通过位于磁头上的激光器对磁碟介质进行瞬间加热,从而以更高密度记录更多数据。西部数据通过优化设计,正在使激光器更加小型化——这意味着每个磁碟的存储容量将从过去的4TB大幅跃升至10TB,再结合在3.5英寸硬盘内封装14个磁碟的工程技术,最终可在2029年实现超过100TB的单盘容量。"就在一年前,100TB这一数字甚至还未被提上议程;当时大家普遍认为这样的容量是遥不可及的,"Ahmed Shihab感慨道。

然而,容量只是AI存储需求的一个维度。随着单盘容量攀升,如果不提升性能,每TB的带宽密度将不升反降,这正是客户的痛点所在。西部数据的高带宽硬盘技术,通过让多个磁头在多个磁道同时进行读写,可在不增加功耗的前提下提供高达传统HDD两倍的带宽,且未来可扩展至4倍、6倍甚至8倍。Ahmed Shihab强调:"西部数据是首个真正实现这一技术的公司。"并且已在客户侧进入验证阶段。

与此同时,双枢轴技术在独立枢轴上增加了第二组独立运行的执行器,可在3.5英寸硬盘内提供高达2倍的顺序IO性能增益。与以往牺牲容量且需要客户大幅度修改软件的双执行器设计不同,双枢轴技术通过缩小磁碟间距,在提升性能的同时搭载更多磁碟,从而兼顾容量。Ahmed Shihab在回答媒体提问时确认,高带宽硬盘技术和双枢轴技术完全可以搭载于同一产品,且皆可应用于ePMR HDD与HAMR HDD,形成性能的叠加效应。

在功耗方面,全新的功耗优化型HDD可降低20%的功耗,仅造成5%到10%的性能代偿,且能进一步将容量提升10%,预计2027年进入客户认证阶段。对于需要数千个硬盘才能存储1EB数据的超大规模数据中心而言,这意味着巨大的电力节省。

除了硬件创新,西部数据还推出了智能平台化方案与软件层,旨在简化新技术的部署。"过去,当硬盘商推出新容量版本或新技术时,客户需要花费大量时间进行软件兼容性测试、机箱适配与数据中心环境验证,"Ahmed Shihab解释道,"通过硬件设计与软件层的结合,我们已代为完成这些繁重的基础工作,客户仅需处理一个非常简单的API接口即可。"需要明确的是,这一平台的核心定位是降低硬盘部署的复杂性,而非替代客户解决数据流转层面的业务逻辑问题。

这些技术创新也是对客户TCO(总体拥有成本)诉求的回应。西部数据面向全球200家超大规模数据中心、云服务提供商及企业级客户的调研显示,在参与调查的中国客户当中,高达90.9%的受访者认为TCO是HDD的首要优势;72.7%的受访者表示,TCO是他们将HDD作为长期战略重要组成部分的关键原因。

从全球视野到中国本土生态的布局

"AI基础设施的投资正在激增,而且年均复合增长非常迅猛,"西部数据全球销售与市场营销副总裁Stefan Mandl从市场维度展开分析。他指出,中国AI市场的投资额增长尤为显著,2025年至2032年的复合增长率达到32.5%[4],超过全球均值31%[5]

为了精准把握中国客户的脉搏,西部数据对全球核心客户和分销商进行了抽样调查,并专门分析了中国客户的具体需求。结果显示,81.8%的中国客户表示需要对AI训练和推理工作负载的良好支持;72.7%的客户希望存储基础设施能够提供更高的可靠性和可用性。"我们做的任何事情都是以服务客户和解决他们的痛点为初心,"Stefan Mandl强调,"从我们公司的价值观出发,其中第一条就是我们的客户。"

那么,西部数据如何实现超大规模的创新交付,特别是在中国市场?Stefan Mandl将其归结为三个层面:首先是先进HDD技术的创新,这是基石;其次是可扩展的存储平台,帮助客户更快、更好地实现规模化扩展;再者是中国本地的工程与制造专业能力——除了深圳工厂,西部数据在中国还设有系统集成测试实验室(SIT Lab),可为客户提供高达三级的深度技术支持,并协助进行产品验证,极大地助力了部署进程。

针对长期供货协议(LTA)的问题,Stefan Mandl进一步阐释了西部数据与客户协同的前瞻性:"早在AI需求激增前,我们就已经与关键客户紧密协作,了解他们的长期需求。这让西部数据建立了未来两三年需求侧的可见度,助力长期、稳定的供应,为市场提供更多确定性。"而Ahmed Shihab则补充道,西部数据持续与客户在早期阶段即分享五年产品路线图——这在业内极为罕见——通过深度共创,不仅限于硬盘研发,还包括软件端及平台等基础设施,从而平衡研发投入、时间成本与客户需求。"这体现了西部数据对客户的不变承诺,"Ahmed表示。

客户怎么看AI存储的"痛点"与"未来"

在高管分享之后,西部数据中国区高级销售总监文芳主持了一场圆桌对谈,邀请阿里云对象存储高级总监罗庆超与比亚迪电子事业部产品总经理崔勇,从应用一线带来了对AI存储基础设施的深刻洞察。

谈及过去一年AI工作负载快速增长带来的需求变化,罗庆超提出了三个关键观察:一是算力与存储的匹配问题,GPU规模越来越大,存储量必须跟上,否则系统便无法运行;二是稳定性问题,对于万卡乃至十万卡的GPU集群,存储系统故障甚至数据丢失将导致算力闲置,成本开销巨大;三是性价比问题,热点数据对性能要求极高,但随着单盘容量增大,单位密度的性能难以持续保持,如何在性能与成本之间弥合Gap,是业界当前的研究课题。"存储已经从幕后走向前台,已经不再是配角,它成为AI系统运行的关键环节,"罗庆超总结道。

崔勇则从智能驾驶领域补充了另一番图景:数据量级呈指数级增长,每天生产的新数据接近PB级;吞吐和并发要求特别高,千卡、万卡的并行训练对存储IO提出了极高要求;而数据在不同阶段——采集、清洗、训练、模型下放——是割裂的,缺乏自动化的全链条闭合流转。他特别指出,企业系统越靠近算力,存储IO性能要求越高,但大量已使用过的数据仍存放在高性能闪存上,考虑到数据仍在快速增长,需要把这些数据移到HDD,"冷热数据分层的自动化管理,对我们来说工作量挺大的一部分。"

当文芳进一步追问智能驾驶领域面临的存储挑战时,崔勇将痛点归纳为三点:存储扩容速度跟不上算力扩容速度;全生命周期数据流转效率低,直接影响AI闭环迭代效率;冷热数据分层管理难度大。"行业最大痛点就是数据跑得太快、算力跑得太快,但存储和数据流转体系要跟上,同时还要在性能、成本、安全、合规之间找到平衡,"崔勇直言。

针对推理工作负载占比不断提升的趋势,罗庆超分享了阿里云在存储分级中的实践:关键在于做好数据流动的算法与能力,在不同容量的盘之间提高流转速度;存储效率包含容量效率与性能效率,阿里云通过自研技术与合并大IO,充分挖掘硬盘性能;长期留存则需与客户数据的访问频率、投资价值及使用模式紧密结合。"这个时代存储的性能、容量、成本三个维度的动态平衡是很关键的事情,"罗庆超表示。

展望未来AI基础建设的演进,两位客户代表的观点形成了呼应——

崔勇认为,行业将从以算力为中心转向以数据为中心驱动的业务模式,需要实现存算深度协同、端边云全域一体化,以及分层存储的精细化智能调度。"谁能在未来更高效、更低成本、更安全用好数据,对做AI智驾就能取得优势地位。"

罗庆超则提出了系统级视角:"AI基础设施的未来演进,不在单点技术的突破,在IDC、算力、网络、存储配套匹配的演进,这才是关键,否则就会出现有算力没存储,有存储没网络。"他将数据系统比喻为河流汇聚而成的数据湖或海,"它是数据最后的保障,存储提供安全、高性价比的能力是非常重要的。我们所需的数据系统,需要实现‘用的稳定、算的安心、存的放心'。"

结语

AI的规模化落地,瓶颈不仅在于算力,更在于如何管理并存储爆发式增长的数据。正如西部数据所言,“AI基础设施本质上是一个数据系统”——从训练、推理到Agentic AI与Physical AI,每种工作负载都在持续生产并累积数据,而这些数据中的绝大部分,仍将长期栖息于HDD之上。

西部数据给出的策略,是在容量、性能、能效与部署效率四个维度同步推进HDD迭代:ePMR与HAMR双轨并行,承诺2029年实现100TB+单盘容量;高带宽硬盘与双枢轴技术实现带宽与顺序IO倍增;功耗优化型HDD降低20%功耗;智能平台化方案则简化新技术的部署门槛。

而在可持续发展层面,Ahmed Shihab指出,HDD的低功耗是其固有特性——以32TB氦气硬盘为例,其功耗约为0.3W/TB,相较旧款4TB空气硬盘的2.85W/TB降低超过9倍。西部数据还设立了2030年净零排放目标,并在制造过程中使用可再生能源,持续探索硬盘的可回收利用。

未来,在SSD与HDD长期共存的存储生态中,HDD凭借大规模部署下的TCO优势与持续扩展的容量路线图,仍是承接AI海量数据“冷”与“温”需求的经济型蓄水池。

相关推荐

登录即可解锁
  • 海量技术文章
  • 设计资源下载
  • 产业链客户资源
  • 写文章/发需求
立即登录