EMC存储raid5阵列瘫痪,数据恢复成功全过程,学会就是赚到

1、服务器数据恢复故障描述

服务器型号:EMCVNXe3100存储
硬盘数量:8块
Raid级别:raid5磁盘阵列
故障表现:2块硬盘离线,服务器崩溃,上层应用不可用
故障状况预判:典型的硬盘离线数量超过raid5的冗余数量致使的服务器数据丢失,能够经过数据恢复操做对原始数据进行恢复,预估数据恢复成功率为90%。服务器

2、对服务器数据进行备份

数据恢复工程师首先将客户服务器内的全部硬盘经过镜像的方式进行备份,在备份过程当中注意检查掉线硬盘是否存在物理故障,在本次数据恢复案例中,客户两块掉线硬盘均不存在物理故障,直接镜像便可。工具

3、服务器底层数据分析及数据恢复过程

镜像完成后,数据恢复工程师归还了客户原始硬盘,开始在镜像文件上分析底层数据,通过底层数据分析计算出服务器原始的硬盘盘序,raid条带大小、raid阵列信息等,经过数据恢复工具重组raid。
因为LUN是基于RAID组的,所以须要根据上述分析的信息将RAID组重组出来。而后分析LUN在RAID组中的分配信息,以及LUN分配的数据块MAP。因为底层只有一个LUN,所以只须要分析一份LUN信息就OK了。而后根据这些信息使用raid恢复程序,解释LUN的数据MAP并导出LUN的全部数据。调试

4、解释ZFS文件系统并修复

数据恢复工程师对导出的lun进行了文件系统解释,在文件系统解释过程当中出现报错,数据恢复工程师对报错内容进行分析,调试文件系统解释程序,通过分析与调试确认是因为存储中某些元文件损坏致使解释zfs文件系统程序报错。数据恢复工程师针对这些损坏的文件进行了手动修复,以确保zfs文件系统能够被正常解析。数据分析

5、服务器数据恢复成功

通过对zfs文件系统的修复和解析,验证最新数据,通过验证数据无误。联系客户管理员对恢复的数据进行验证,确认数据恢复成功,数据恢复率为100%。程序

相关文章
相关标签/搜索