大家遭遇过电脑硬盘故障导致所有数据丢失的情况吗?
得知数据无法恢复后欲哭无泪,一想到几年来保存的生活影像、学习资料,辛苦积累的实验数据竟荡然无存,简直是心痛到无法呼吸!
个人数据丢失已令人难以接受,万一企业级服务器的储存系统崩盘,比如银行的金融服务器、互联网企业的训练服务器发生数据丢失,影响更是难以估量。
为避免此类情况,同时为提高海量数据的读写速率,RAID(Redundant Arrays of Independent Disks,独立冗余磁盘阵列)应运而生。
为了更好地认识 RAID,我们先来了解以下概念。
01、硬盘,磁盘,磁盘阵列?傻傻分不清楚
硬盘
即硬磁盘,作为现代计算机的主要存储设备,容量大,读写快,主要分为新式固态硬盘、传统机械硬盘和混合硬盘。
软盘
既然有硬磁盘,当然也有软磁盘(即软盘)。软盘是早期个人计算机使用的可移动储存介质,彼时常用容量仅 1.4MB 的 3.5 英寸软盘,读写速度慢,早已淡出市场。
软、硬磁盘统称为磁盘,“磁”表示利用磁记录技术存储数据。
磁盘阵列
RAID 即由独立磁盘构成的具有冗余能力的阵列,简称磁盘阵列。
一般电脑配备 1~2 个硬盘即可满足基本需求,而企业服务器对于数据的存储容量和读写速度要求极高,普通硬盘远远无法满足。于是工程师们将多个独立硬盘组成一个超大容量组,以提供比单盘更高的存储性能、I / O 性能、可靠性。
02、初识 RAID 的一些疑问
初识 RAID,可能对概念还有一些疑问,小编先进行简单答疑~
原来 RAID 就是叠加了多层不同 Buff 的一个大硬盘呀?
严格来说,RAID 是一种多硬盘运作方式,是一项高性能存储技术。为便于理解,可以将 RAID 视为:多块普通硬盘通过不同形式组合而成的一块具有加成效果的大硬盘。
原来如此~RAID 与单纯增加硬盘相比,有什么区别吗?
增加硬盘只是增加储存空间,每次仍然只能读写一个盘,硬盘一旦损坏将导致数据丢失。而在 RAID 中,数据分散储存在多个硬盘上,通过并行处理提高读写数据的带宽和速度。并且多个硬盘同时工作增加了平均故障间隔时间,即便某个硬盘故障,及时替换便不会影响整个阵列的正常工作,还能够还原故障硬盘中的数据。
明白了!也就是说 RAID 能大幅度提高硬盘组的数据吞吐量,并且提供容错功能,保障数据安全。
这波总结非常到位!下面向大家介绍 RAID 如何组合硬盘来实现这些功能。
03、RAID 级别
RAID 主要利用分条、镜像、数据校验这三种技术来组合硬盘。首先介绍四种标准型 RAID。
RAID 0
又称为条带化或分条,将连续数据(A1 ~ A8)分散写入多个硬盘,能够并发执行读写,充分利用总线带宽,储存性能最高。一旦单盘故障将威胁数据安全,只适用于不求安全、只求速度的场景。
有更安全的方案吗?
RAID 1
又称镜像,将一段数据(A1 ~ A4)分别写入工作盘和镜像盘,相当于全自动实时备份,数据安全性最高。但实现成本高,硬盘利用率低,仅适用于全力保障安全的场景,如金融、监控服务器。
有兼顾性能和安全的方案吗?
RAID 5
将连续数据分散(A1 ~ A3, B1 ~ B3, C1 ~ C3, D1 ~ D3)和相应的奇偶校验信息(Ap, Bp, Cp, Dp, Ep)分别写入不同硬盘,单盘故障时可以利用正常盘数据与奇偶校验信息进行异或来恢复数据。RAID 5 兼顾储存的性能、成本、可靠性,常见于民用的各类私有 NAS 服务器。
两块硬盘同时损坏怎么办呢?
RAID 6
在 RAID 5 的基础上增加了一组奇偶校验信息(Aq, Bq, Cq, Dq, Eq),两组独立的奇偶校验信息可以实现双重校验,在两块硬盘同时损坏的情况下也能恢复数据。RAID 6 读性能与容错性能更高,但写性能低,实现成本高。
将标准型 RAID“做加法”,可获取以下三种平衡性能与可靠性的混合型 RAID。
RAID 1+RAID 0=RAID 10
RAID 10 可理解为:用四个硬盘(Disk 0 和 Disk 1,Disk 2 和 Disk 3)分别组成两个 RAID 1,再将两个 RAID 1 组成一个 RAID 0。RAID 10 兼具二者优点,但硬盘利用率不高。
RAID 5+RAID 0=RAID 50
RAID 50 中,由多个 RAID 5 卷组成一个 RAID 0,RAID 50 可以承担多个卷内同时发生单盘故障的风险,极大提升了容错能力,同时继承了 RAID 0 的高储存性能。
RAID 6+RAID 0=RAID 60
RAID 60 整体结构及特点与 RAID 50 相似,还继承了 RAID 6 的优点,即便多个 RAID 6 卷内同时发生双盘故障,也不会影响数据的安全性。
各级 RAID 在读写性能和安全可靠性之间各有侧重,小编做出以下总结:
由表可知,RAID 特点是:实现更大的容量、更高的 I / 0 性能、更强的数据安全可靠性。
04、怎么才能用上 RAID 呢?
读到这里,相信大家已经知道了 RAID 的优点,但可能对于如何使用 RAID 仍心存困惑。其实,RAID 有以下三种实现方式:
软件 RAID
集成于服务器操作系统中,配置管理简单,成本低,所有任务均由 CPU 执行,导致 CPU 负荷重,整体性能较差。
硬件 RAID
具备计算单元与 I / O 处理器,独立于操作系统来管理 RAID 配置。比如外接式磁盘阵列柜、内接式磁盘阵列卡。虽然成本较高,但使用和配置更灵活,能够提供更好的性能,充分发挥 RAID 的特点,因此应用规模更大。
软硬混合 RAID
拥有 RAID 控制器和驱动程序,但缺乏 I / O 处理器,仍需要依靠驱动程序来执行任务。
PCIe 形式的 RAID 卡的外部结构如下图所示。
RAID 卡不仅结合 RAID Cache,提升数据的读写和传输性能,而且提供了一些强大功能,如:
■ 硬盘直通:用户指令直接透传到硬盘。
■ 硬盘节能:允许硬盘在空闲时停转。
■ 数据掉电保护:提供超级电容进行供电及电量校准。
■ 热备份:提供热备盘自动替换故障盘,未设置热备盘时则自动使用空闲盘替换故障盘。
■ 一致性校验:定期计算数据并与对应的冗余数据进对比,若不一致将自动修复并保存错误信息。
05、总结
随着硬盘接口和处理器等技术的逐步发展,RAID 技术日渐成熟,凭借其大容量、高性能、可靠可控等优势,广泛应用于中大型数据库、高性能计算、互联网应用等领域,满足广大企业用户对数据存储容量、I / O 性能、数据安全性、业务连续性等多方面需求。
目前,关于 RAID 已涌现了负载均衡、故障检测、隔离恢复等许多技术,期待未来能够迸发出革命性的新技术,推动 RAID 的长足进步。
本文来自微信公众号:中兴文档 (ID:ztedoc)