RAID磁盘阵列原理

磁盘阵列(Redundant Arrays of independent Disks,RAID),有“价格便宜具备冗余能力的磁盘阵列”之意。原理是利用数组方式来做磁盘组,配合数据分散排列的设计,提高数据的安全性。磁盘阵列是由不少价格较便宜的磁盘,组合成一个容量巨大的磁盘组,利用个别磁盘提供数据所产生加成效果提高整个磁盘系统效能。利用这项技术,将数据切割成许多区段,分别存放在各个硬盘上。磁盘阵列还能利用同位检查(Parity Check)的观念,在数组中任一颗硬盘故障时,仍可读出数据,在数据重构时,将数据经计算后从新置入新硬盘中。算法

 

磁盘阵列其样式有三种,一是外接式磁盘阵列柜、二是内接式磁盘阵列卡,三是利用软件来仿真。
外接式磁盘阵列柜最常被使用大型服务器上,具可热抽换(Hot Swap)的特性,不过这类产品的价格都很贵。
内接式磁盘阵列卡,由于价格便宜,但须要较高的安装技术,适合技术人员使用操做。
利用软件仿真的方式,因为会拖累机器的速度,不适合大数据流量的服务器。数组

RAID0没有冗余功能,若是一个磁盘(物理)损坏,则全部的数据都没法使用。
RAID1磁盘的利用率最高只能达到50%(使用两块盘的状况下),是全部RAID级别中最低的。
RAID0+1以理解为是RAID 0和RAID 1的折中方案。RAID 0+1能够为系统提供数据安全保障,但保障程度要比 Mirror低而磁盘空间利用率要比Mirror高。
RAID 0:RAID 0连续以位或字节为单位分割数据,并行读/写于多个磁盘上,所以具备很高的数据传输率,但它没有数据冗余,所以并不能算是真正的RAID结构。RAID 0只是单纯地提升性能,并无为数据的可靠性提供保证,并且其中的一个磁盘失效将影响到全部数据。所以,RAID 0不能应用于数据安全性要求高的场合。
安全

 

RAID 1:它是经过磁盘数据镜像实现数据冗余,在成对的独立磁盘上产生互为备份的数据。当原始数据繁忙时,可直接从镜像拷贝中读取数据,所以RAID 1能够提升读取性能。RAID 1是磁盘阵列中单位成本最高的,但提供了很高的数据安全性和可用性。当一个磁盘失效时,系统能够自动切换到镜像磁盘上读写,而不须要重组失效的数据。服务器

 

RAID 01/10:根据组合分为RAID 10和RAID 01,实际是将RAID 0和RAID 1标准结合的产物,在连续地以位或字节为单位分割数据而且并行读/写多个磁盘的同时,为每一块磁盘做磁盘镜像进行冗余。它的优势是同时拥有RAID 0的超凡速度和RAID 1的数据高可靠性,可是CPU占用率一样也更高,并且磁盘的利用率比较低。RAID 1+0是先镜射再分区数据,再将全部硬盘分为两组,视为是RAID 0的最低组合,而后将这两组各自视为RAID 1运做。RAID 0+1则是跟RAID 1+0的程序相反,是先分区再将数据镜射到两组硬盘。它将全部的硬盘分为两组,变成RAID 1的最低组合,而将两组硬盘各自视为RAID 0运做。性能上,RAID 0+1比RAID 1+0有着更快的读写速度。可靠性上,当RAID 1+0有一个硬盘受损,其他三个硬盘会继续运做。RAID 0+1 只要有一个硬盘受损,同组RAID 0的另外一只硬盘亦会中止运做,只剩下两个硬盘运做,可靠性较低。所以,RAID 10远较RAID 01经常使用,零售主板绝大部份支持RAID 0/1/5/10,但不支持RAID 01。工具

 

RAID 2:将数据条块化地分布于不一样的硬盘上,条块单位为位或字节,并使用称为“加剧平均纠错码(汉明码)”的编码技术来提供错误检查及恢复。
RAID 3:它同RAID 2很是相似,都是将数据条块化分布于不一样的硬盘上,区别在于RAID 3使用简单的奇偶校验,并用单块磁盘存放奇偶校验信息。若是一块磁盘失效,奇偶盘及其余数据盘能够重新产生数据;若是奇偶盘失效则不影响数据使用。RAID 3对于大量的连续数据可提供很好的传输率,但对于随机数据来讲,奇偶盘会成为写操做的瓶颈。性能

 

RAID 4:RAID 4一样也将数据条块化并分布于不一样的磁盘上,但条块单位为块或记录。RAID 4使用一块磁盘做为奇偶校验盘,每次写操做都须要访问奇偶盘,这时奇偶校验盘会成为写操做的瓶颈,所以RAID 4在商业环境中也不多使用。大数据

RAID 5:RAID 5不单独指定的奇偶盘,而是在全部磁盘上交叉地存取数据及奇偶校验信息。在RAID 5上,读/写指针可同时对阵列设备进行操做,提供了更高的数据流量。RAID 5更适合于小数据块和随机读写的数据。RAID 3与RAID 5相比,最主要的区别在于RAID 3每进行一次数据传输就需涉及到全部的阵列盘;而对于RAID 5来讲,大部分数据传输只对一块磁盘操做,并可进行并行操做。在RAID 5中有“写损失”,即每一次写操做将产生四个实际的读/写操做,其中两次读旧的数据及奇偶信息,两次写新的数据及奇偶信息。编码

 

RAID 6:与RAID 5相比,RAID 6增长了第二个独立的奇偶校验信息块。两个独立的奇偶系统使用不一样的算法,数据的可靠性很是高,即便两块磁盘同时失效也不会影响数据的使用。但RAID 6须要分配给奇偶校验信息更大的磁盘空间,相对于RAID 5有更大的“写损失”,所以“写性能”很是差。较差的性能和复杂的实施方式使得RAID 6不多获得实际应用。spa

RAID 7:这是一种新的RAID标准,其自身带有智能化实时操做系统和用于存储管理的软件工具,可彻底独立于主机运行,不占用主机CPU资源。RAID 7能够看做是一种存储计算机(Storage Computer),它与其余RAID标准有明显区别。除了以上的各类标准(如表1),咱们能够如RAID 0+1那样结合多种RAID规范来构筑所需的RAID阵列,例如RAID 5+3(RAID 53)就是一种应用较为普遍的阵列形式。用户通常能够经过灵活配置磁盘阵列来得到更加符合其要求的磁盘存储系统。操作系统

RAID 5E(RAID 5 Enhancement): RAID 5E是在RAID 5级别基础上的改进,与RAID 5相似,数据的校验信息均匀分布在各硬盘上,可是,在每一个硬盘上都保留了一部分未使用的空间,这部分空间没有进行条带化,最多容许两块物理硬盘出现故障。看起来,RAID 5E和RAID 5加一块热备盘好像差很少,其实因为RAID 5E是把数据分布在全部的硬盘上,性能会比RAID5 加一块热备盘要好。当一块硬盘出现故障时,有故障硬盘上的数据会被压缩到其它硬盘上未使用的空间,逻辑盘保持RAID 5级别。

RAID 5EE: 与RAID 5E相比,RAID 5EE的数据分布更有效率,每一个硬盘的一部分空间被用做分布的热备盘,它们是阵列的一部分,当阵列中一个物理硬盘出现故障时,数据重建的速度会更快。

RAID 50:RAID50是RAID5与RAID0的结合。此配置在RAID5的子磁盘组的每一个磁盘上进行包括奇偶信息在内的数据的剥离。每一个RAID5子磁盘组要求三个硬盘。RAID50具有更高的容错能力,由于它容许某个组内有一个磁盘出现故障,而不会形成数据丢失。并且由于奇偶位分部于RAID5子磁盘组上,故重建速度有很大提升。优点:更高的容错能力,具有更快数据读取速率的潜力。须要注意的是:磁盘故障会影响吞吐量。故障后重建信息的时间比镜像配置状况下要长。

相关文章
相关标签/搜索