保证大规模云存储系统稳定性的主动容错技术的详细说明
[摘要]

除了传统的冗余机制,主动容错技术也被用来提高存储系统的可靠性。然而,当前对主动容错云存储系统可靠性的研究工作很少,而且都局限于硬盘故障服从指数分布的假设前提。针对主动容错磁盘冗余阵列RAID-5和RAID-6云存储系统提出两个可靠性状态转移模型,并基于转移模型设计了蒙特卡洛仿真算法,评价系统在一定运行周期内发生数据丢失事件的期望个数。该算法采用韦布分布函数模拟随时间变化(降低、恒定不变、或升高)的硬盘故障率,准确评价了主动容错机制、硬盘整体故障、故障修复、潜在块故障以及磁盘清洗过程对系统可靠性的影响。所提方法可以帮助系统设计者评估不同容错机制和系统参数对云存储系统可靠性的影响,有助于创建高可靠存储系统。

 

近年来,大规模云存储系统已成为主流IT企业的主要存储架构,因为价格等方面的优势,硬盘仍然是它们的主要存储介质。由于制作工艺及技术的进步,单体硬盘的可靠性不断提高,但是,在包含成千上万块硬盘的大规模云存储系统中,硬盘故障甚至是并发故障时有发生。硬盘故障不仅会引起服务中断、降低用户服务体验,甚至会导致数据的永久丢失,给企业和用户带来无法挽回的损失。因此,当前大规模云存储系统面临着高可靠性的挑战。

资源类型:pdf
资源大小:1.13MB
所属分类:
上传时间:2019/01/07