磁盘阵列(Redundant Arrays of Independent Disks,RAID)html
1. 存储的数据必定分片;算法
2. 分基于软件的软RAID(如mdadm)和基于硬件的硬RAID(如RAID卡);数据库
3. RAID卡如同网卡同样有集成板载的也有独立的(PCI-e),通常独立RAID卡性能相对较好,淘宝一搜即可看到他们的原形;数组
4. 如今基本上服务器都原生硬件支持几种经常使用的RAID;安全
5. 固然还有更加高大上的专用于存储的磁盘阵列柜产品,有专用存储技术,规格有如12/24/48盘一柜等,盘可选机械/固态,3.5/2.5寸等。服务器
|
|||||||||
级别网络 |
特征工具 |
原理性能 |
单元编码 |
冗余 |
性能 |
利用率 |
最多坏 |
用途 |
缺陷 |
RAID0 |
条带 |
分片分散存入2块硬盘 |
2 |
否 |
读写速度2倍 |
100% |
0/2 |
SWAP/TMP |
不冗余,数据难恢复 |
RAID1 |
镜像 |
相同数据存入2块硬盘 |
2 |
是 |
写速度不变 读速度2倍 |
50% |
1/2 |
数据备份 |
读写速度没加,利用率低 |
RAID4 |
校验 |
分片分散存入2块硬盘 校验码存入第3块硬盘 |
3 |
是 |
读写速度2倍 |
2/3=66% |
1/3 |
用的不多 |
1. 坏盘时另外2块须要从新计算还原坏盘数据 2. 校验码盘压力大成为瓶颈 |
RAID5 |
校验 |
分片和校验码混合存储 |
3 |
是 |
读写速度2倍 |
2/3=66% |
1/3 |
用的很少 |
坏盘时另外2块须要从新计算还原坏盘数据 |
RAID6 |
校验 |
分片盘校验码盘分别2个 数据分片校验码计算2次 |
4 |
是 |
读写速度2倍 |
2/4 |
2/4 1∈2 |
用的不多 |
“部队中有一半是搞后勤的,感受仍是不太爽。” |
RAID10 |
1+0 |
2块硬盘1组先作RAID1 多组RAID1再作RAID0 |
4 |
是 |
读写速度N倍 N为组数 |
2/4 |
2/4 1∈2 |
用的最多 |
- |
RAID50 |
5+0 |
3块硬盘1组先作RAID5 多组再作RAID0 |
6 |
是 |
读写数读2N倍 N为组数 |
4/6 |
2/6 1∈3 |
土豪用的 |
“好是好,就是贵!”
|
近来想创建一个私有云系统,涉及到安装使用一台网络存储服务器。对于服务器中硬盘的链接,选用哪一种RAID模式能准确知足需求收集了资料,简单整理后记录以下:
1、RAID模式优缺点的简要介绍
目前被运用较多的RAID模式其优缺点大体是这样的:
一、RAID0模式
优势:在RAID 0状态下,存储数据被分割成两部分,分别存储在两块硬盘上,此时移动硬盘的理论存储速度是单块硬盘的2倍,实际容量等于两块硬盘中较小一块硬盘的容量的2倍。
缺点:任何一块硬盘发生故障,整个RAID上的数据将不可恢复。
备注:存储高清电影比较适合。
二、RAID1模式
优势:此模式下,两块硬盘互为镜像。当一个硬盘受损时,换上一块全新硬盘(大于或等于原硬盘容量)替代原硬盘便可自动恢复资料和继续使用,移动硬盘的实际容量等于较小一块硬盘的容量,存储速度与单块硬盘相同。RAID 1的优点在于任何一块硬盘出现故障是,所存储的数据都不会丢失。
缺点:该模式可以使用的硬盘实际容量比较小,仅仅为两颗硬盘中最小硬盘的容量。
备注:很是重要的资料,如数据库,我的资料,是万无一失的存储方案。
三、RAID 0+1模式
RAID 0+1是磁盘分段及镜像的结合,采用2组RAID0的磁盘阵列互为镜像,它们之间又成为一个RAID1的阵列。硬盘使用率只有50%,可是提供最佳的速度及可靠度。
四、RAID 3模式
RAID3是把数据分红多个“块”,按照必定的容错算法,存放在N+1个硬盘上,实际数据占用的有效空间为N个硬盘的空间总和,而第N+1个硬盘存储的数据是校验容错信息,当这N+1个硬盘中的其中一个硬盘出现故障时,从其它N个硬盘中的数据也能够恢复原始数据。
五、RAID 5模式
RAID5不对存储的数据进行备份,而是把数据和相对应的奇偶校验信息存储到组成RAID5的各个磁盘上,而且奇偶校验信息和相对应的数据分别存储于不一样的磁盘上。当RAID5的一个磁盘数据发生损坏后,利用剩下的数据和相应的奇偶校验信息去恢复被损坏的数据。
六、RAID 10模式
RAID10最少须要4块硬盘才能完成。把2块硬盘组成一个RAID1,而后两组RAID1组成一个RAID0。虽然RAID10方案形成了50%的磁盘浪费,可是它提供了200%的速度和单磁盘损坏的数据安全性。
2、另外三种硬件快速硬件设置模式简介
在收集资料时看到有的硬件设备提供快速磁盘模式设置,也很方便你们的使用,具体状况以下:
一、Clone模式
克隆模式,磁盘所有数据同样,以最小硬盘的为准。
二、Large模式
硬盘容量简单相加,将几个硬盘变成一个硬盘,容量为几个硬盘容量之和,此模式下能够得到最大的硬盘空间。
三、Normal模式
硬盘分别处于正常、独立的状态,能够分别独立的写入或读取资料,能使用的实际容量分别为4个硬盘的容量。若是其中一个硬盘受损,其余几个硬盘不会受影响。
3、RAID使用简明注意事项
★使用前请先备份硬盘的资料,一旦进行RAID设定或是变动RAID模式,将会清除硬盘里的全部资料,以及没法恢复;
★创建RAID时,建议使用相同品牌、型号和容量的硬盘,以确保性能和稳定;
★请勿随意更换或取出硬盘,若是取出了硬盘,请记下硬盘放入两个仓位的顺序不得更改,以及请勿只插入某一块硬盘使用,以免形成资料损坏或丢失;
★若是旧硬盘曾经在RAID模式下使用,请先进清除硬盘RAID信息,让硬盘回复至出厂状态,以避免RAID创建失败;
★RAID0模式下,其中一个硬盘损坏时,其它硬盘全部资料都将丢失;
★RAID1模式下,若是某一块硬盘受损,能够用一块大于或等于受损硬盘容量的新硬盘替换坏硬盘而后开机便可自动恢复和修复资料以及RAID模式。此过程须要必定时间,请耐心等待
4、细数RAID模式
一、概念
磁盘阵列(Redundant Arrays of Inexpensive Disks,RAID),有“价格便宜且多余的磁盘阵列”之意。原理是利用数组方式来做磁盘组,配合数据分散排列的设计,提高数据的安全性。磁盘阵列是由不少便宜、容量较小、稳定性较高、速度较慢磁盘,组合成一个大型的磁盘组,利用个别磁盘提供数据所产生加成效果提高整个磁盘系统效能。同时利用这项技术,将数据切割成许多区段,分别存放在各个硬盘上。磁盘阵列还能利用同位检查(Parity Check)的观念,在数组中任一颗硬盘故障时,仍可读出数据,在数据重构时,将数据经计算后从新置入新硬盘中。
二、规范
RAID技术主要包含RAID 0~RAID 50等数个规范,它们的侧重点各不相同,常见的规范有以下几种:
RAID 0:RAID 0连续以位或字节为单位分割数据,并行读/写于多个磁盘上,所以具备很高的数据传输率,但它没有数据冗余,所以并不能算是真正的RAID结构。RAID 0只是单纯地提升性能,并无为数据的可靠性提供保证,并且其中的一个磁盘失效将影响到全部数据。所以,RAID 0不能应用于数据安全性要求高的场合。
RAID 1:它是经过磁盘数据镜像实现数据冗余,在成对的独立磁盘上产生互为备份的数据。当原始数据繁忙时,可直接从镜像拷贝中读取数据,所以RAID 1能够提升读取性能。RAID 1是磁盘阵列中单位成本最高的,但提供了很高的数据安全性和可用性。当一个磁盘失效时,系统能够自动切换到镜像磁盘上读写,而不须要重组失效的数据。
RAID 0+1: 也被称为RAID 10标准,实际是将RAID 0和RAID 1标准结合的产物,在连续地以位或字节为单位分割数据而且并行读/写多个磁盘的同时,为每一块磁盘做磁盘镜像进行冗余。它的优势是同时拥有RAID 0的超凡速度和RAID 1的数据高可靠性,可是CPU占用率一样也更高,并且磁盘的利用率比较低。
RAID 2:将数据条块化地分布于不一样的硬盘上,条块单位为位或字节,并使用称为“加剧平均纠错码(海明码)”的编码技术来提供错误检查及恢复。这种编码技术须要多个磁盘存放检查及恢复信息,使得RAID 2技术实施更复杂,所以在商业环境中不多使用。
RAID 3:它同RAID 2很是相似,都是将数据条块化分布于不一样的硬盘上,区别在于RAID 3使用简单的奇偶校验,并用单块磁盘存放奇偶校验信息。若是一块磁盘失效,奇偶盘及其余数据盘能够重
新产生数据;若是奇偶盘失效则不影响数据使用。RAID 3对于大量的连续数据可提供很好的传输率,但对于随机数据来讲,奇偶盘会成为写操做的瓶颈。
RAID 4:RAID 4一样也将数据条块化并分布于不一样的磁盘上,但条块单位为块或记录。RAID 4使用一块磁盘做为奇偶校验盘,每次写操做都须要访问奇偶盘,这时奇偶校验盘会成为写操做的瓶颈,所以RAID 4在商业环境中也不多使用。
RAID 5:RAID 5不单独指定的奇偶盘,而是在全部磁盘上交叉地存取数据及奇偶校验信息。在RAID 5上,读/写指针可同时对阵列设备进行操做,提供了更高的数据流量。RAID 5更适合于小数据块和随机读写的数据。RAID 3与RAID 5相比,最主要的区别在于RAID 3每进行一次数据传输就需涉及到全部的阵列盘;而对于RAID 5来讲,大部分数据传输只对一块磁盘操做,并可进行并行操做。在RAID 5中有“写损失”,即每一次写操做将产生四个实际的读/写操做,其中两次读旧的数据及奇偶信息,两次写新的数据及奇偶信息。
RAID 6:与RAID 5相比,RAID 6增长了第二个独立的奇偶校验信息块。两个独立的奇偶系统使用不一样的算法,数据的可靠性很是高,即便两块磁盘同时失效也不会影响数据的使用。但RAID 6须要分配给奇偶校验信息更大的磁盘空间,相对于RAID 5有更大的“写损失”,所以“写性能”很是差。较差的性能和复杂的实施方式使得RAID 6不多获得实际应用。
RAID 7:这是一种新的RAID标准,其自身带有智能化实时操做系统和用于存储管理的软件工具,可彻底独立于主机运行,不占用主机CPU资源。RAID 7能够看做是一种存储计算机(Storage Computer),它与其余RAID标准有明显区别。除了以上的各类标准(如表1),咱们能够如RAID 0+1那样结合多种RAID规范来构筑所需的RAID阵列,例如RAID 5+3(RAID 53)就是一种应用较为普遍的阵列形式。用户通常能够经过灵活配置磁盘阵列来得到更加符合其要求的磁盘存储系统。
RAID 5E(RAID 5 Enhencement): RAID 5E是在RAID 5级别基础上的改进,与RAID 5相似,数据的校验信息均匀分布在各硬盘上,可是,在每一个硬盘上都保留了一部分未使用的空间,这部分空间没有进行条带化,最多容许两块物理硬盘出现故障。看起来,RAID 5E和RAID 5加一块热备盘好象差很少,其实因为RAID 5E是把数据分布在全部的硬盘上,性能会比RAID5 加一块热备盘要好。当一块硬盘出现故障时,有故障硬盘上的数据会被压缩到其它硬盘上未使用的空间,逻辑盘保持RAID 5级别。
RAID 5EE: 与RAID 5E相比,RAID 5EE的数据分布更有效率,每一个硬盘的一部分空间被用做分布的热备盘,它们是阵列的一部分,当阵列中一个物理硬盘出现故障时,数据重建的速度会更快。
RAID 50:RAID50是RAID5与RAID0的结合。此配置在RAID5的子磁盘组的每一个磁盘上进行包括奇偶信息在内的数据的剥离。每一个RAID5子磁盘组要求三个硬盘。RAID50具有更高的容错能力,由于它容许某个组内有一个磁盘出现故障,而不会形成数据丢失。并且由于奇偶位分部于RAID5子磁盘组上,故重建速度有很大提升。优点:更高的容错能力,具有更快数据读取速率的潜力。须要注意的是:磁盘故障会影响吞吐量。故障后重建信息的时间比镜像配置状况下要长。
三、优势
提升传输速率。RAID经过在多个磁盘上同时存储和读取数据来大幅提升存储系统的数据吞吐量(Throughput)。在RAID中,可让不少磁盘驱动器同时传输数据,而这些磁盘驱动器在逻辑上又是一个磁盘驱动器,因此使用RAID能够达到单个磁盘驱动器几倍、几十倍甚至上百倍的速率。这也是RAID最初想要解决的问题。由于当时CPU的速度增加很快,而磁盘驱动器的数据传输速率没法大幅提升,因此须要有一种方案解决两者之间的矛盾。RAID最后成功了。
经过数据校验提供容错功能。普通磁盘驱动器没法提供容错功能,若是不包括写在磁盘上的CRC(循环冗余校验)码的话。RAID容错是创建在每一个磁盘驱动器的硬件容错功能之上的,因此它提供更高的安全性。在不少RAID模式中都有较为完备的相互校验/恢复的措施,甚至是直接相互的镜像备份,从而大大提升了RAID系统的容错度,提升了系统的稳定冗余性。
四、实现
磁盘阵列有两种方式能够实现,那就是“软件阵列”与“硬件阵列”。
软件阵列是指经过网络操做系统自身提供的磁盘管理功能将链接的普通SCSI卡上的多块硬盘配置成逻辑盘,组成阵列。软件阵列能够提供数据冗余功能,可是磁盘子系统的性能会有所下降,有的下降幅度还比较大,达30%左右。
硬件阵列是使用专门的磁盘阵列卡来实现的。硬件阵列可以提供在线扩容、动态修改阵列级别、自动数据恢复、驱动器漫游、超高速缓冲等功能。它能提供性能、数据保护、可靠性、可用性和可管理性的解决方案。阵列卡专用的处理单元来进行操做,它的性能要远远高于常规非阵列硬盘,而且更安全更稳定。
磁盘阵列其实也分为软阵列 (Software Raid)和硬阵列 (Hardware Raid) 两种. 软阵列即经过软件程序并由计算机的 CPU提供运行能力所成. 因为软件程式不是一个完整系统故只能提供最基本的 RAID容错功能. 其余如热备用硬盘的设置, 远程管理等功能均一一欠奉. 硬阵列是由独立操做的硬件提供整个磁盘阵列的控制和计算功能. 不依靠系统的CPU资源.
因为硬阵列是一个完整的系统, 全部须要的功能都可以作进去. 因此硬阵列所提供的功能和性能均比软阵列好. 并且, 若是你想把系统也作到磁盘阵列中, 硬阵列是惟一的选择. 故咱们能够看市场上 RAID 5 级的磁盘阵列均为硬阵列. 软 阵列只适用于 Raid 0 和 Raid 1. 对于咱们作镜像用的镜像塔, 确定不会用 Raid 0或 Raid 1。做为高性能的存储系统,已经获得了愈来愈普遍的应用。RAID的级别从RAID概念的提出到如今,已经发展了六个级别,其级别分别是0、一、二、三、四、5等。可是最经常使用的是0、一、三、5四个级别。
5、我的用户该选那种RAID模式
首先要分析清楚,咱们须要存储的文件有什么样的属性。这其中须要大量存储的和占用存储量大的文件是两回事儿。
从使用角度粗略分,我的须要存储的文件大体有文本文件、照片录像、影音文件、应用程序等。
一、文本文件:大量长期存放,阶段性更新,但其占用空间小,安全性要求个别较高,大部分通常;
二、照片录像:大量长期存放,永久性记录,占用空间大,安全性要求高,一旦损失很难弥补;
三、影音文件:一部分大量长期存放,一部分大量短时间存放,阶段性更新,占用空间大,安全性要求通常,即使损失了,也能够再从网络上下载恢复;
四、应用程序:这其中包括一些软件和硬件的驱动等,对于软件,目前基本能够从网络上得到,驱动程序有时须要预先备份,安装设备时随时可用,属于量少但要长期存放的,阶段性更新,安全性要求通常。
看看本身须要对哪一种类型的文件进行存储,再选择本身须要的RAID模式便可。
本人的照片和私人录影资料较多,平时喜欢收集APE等无损格式的音乐文件,对于我的来讲这都是至宝,不可有所损失,再有就是一些硬件的驱动程序,相对比较重要,另外会编辑少许的我的文件,阶段性比较重要,最后是影片,看完也就删除了,不过重要。而照片录像和无损音乐占用的空间又是巨大的,安全性要求又很高,权衡后,在节约资金确保安全的前提下,准备购置五块大容量硬盘,组成NAS存储服务器,选择RAID5模式。
顺便说,购置五快硬盘的缘由还有一个,就是我使用的是老机箱改造NAS服务器,市面上有3转5的硬盘笼子能够简单将原有的3个光驱位变成5块硬盘的存储位,考虑到家用存储8T的容量已经足够了,10T基本上能够无忧了,因此选择了5块硬盘,每块2T容量。固然组成RAOD5后会少于10T,那也足够了!
NAS的好处不少,这里就不在赘述,有兴趣的朋友建议深刻了解。它既能够完成集中存储还能够完成诸如自动BT下载,网络打印机,苹果媒体服务器等众多私有云功能,是很好的家庭网络应用解决方案。