了解raid数据恢复首先知道raid是什么?raid磁盘阵列多用于存储服务器,数据服务器等企业级大数据存储领域,RAID是把多块独立的物理硬盘按不同方式组合起来形成一个逻辑硬盘,当raid瘫痪或硬件损坏后,为了恢复存储在raid平台的数据被称之为raid数据恢复,RAID阵列能够提供比单个硬盘有着更高的性能和提供数据冗余的技术。
RAID阵列发生故障后的错误操作,这是十分危险的事情!在RAID数据恢复案例统计中发现,不能恢复的RAID数据往往是再次的错误操作导致。
当RAID阵列不正常或无法启动的时候,如何有效的保护数据不被破坏,以下几种情况的操作有可能对阵列造成数据破坏:
1.强制Online
这个操作是很容易对阵列造成数据破坏的,尤其是当有2块或以上的盘掉线的时候,如果不知道哪个盘先掉线,哪个盘后掉线的话,一但破坏了,数据将有可能变成旧的,而且无法恢复成最新的数据。
例如:RAID5阵列,4块盘,0号和2号掉线。假设0号盘先掉线,1个月后2号盘又掉线,这个时候如果将2块盘强制在线的话,因为0号盘1个月前就掉线了,这一个月当中对数据做的很多的改变,这块盘的数据已经不能通过RAID的检验了,阵列是无法分析数据的新旧的,所以阵列有可能用0号盘+1、3号盘去
Rebuild 2号盘,这样一来,2号盘的数据也就成了不正确的了,将无法恢复,最多也只能恢复到1个月前的部分数据。
2.Rebuild
例如:RAID5阵列,4块盘,Rebuild操作的实际意义是,用其中3块盘做异或运算,将结果写到另一块盘中。这里要求,用来做异或运算的3块盘的数据一定要是正确的,如果其中有一块或多块不正确哪么异或出来的结果也就是不正确的。
3.更换RAID卡或主机
目前大部分RAID卡都是支持这种操作的,在阵列正常的情况下这个操作是不会破坏数据的。但是,在阵列已经瘫痪或是无法正常工作的时候,这个操作将有可
能导致RAID对硬盘做不正常的Rebuild和校验,所以当阵列出现问题的时候,要准确判断是阵列卡有问题,还是硬盘有问题,不要轻易去尝试更换
RAID卡或主机。
4.把报错的硬盘全部拔下来再插上去
拔下来没关系,但是如果再全插上去的话阵列将重新去识别插上去的硬盘,这时如果硬盘中的阵列信息或数据有误的话,会导致阵列做出错的Rebuild操作。
如果是怀疑硬盘接触不好的话,可以一块一块的拔,再一块一块的插上去。不要一次都拔下来。或者可以的话,关机后,再进行插拔。
5.操作系统的check disk
Windows,Linux,Unix等操作系统都有自己的一个硬盘检测程序,当你硬盘中的分区或文件出现问题无法正常读取的时候,操作系统就会在重启
的时候去自动运行Check disk去试图修复,这时,如果是阵列的检验出现问题而导致分区或文件出错的话,运行Check
disk将有可能破坏阵列中数据。
6.对RAID中单块硬盘进行写操作
一件事情或一个工作做的多了,你可能什么情况都能遇到,这一项我们是很不愿意列出来,但是就有人这么做了,所以不得不拿出来提醒一个。阵列中的硬盘是一个整体,破坏其它一块硬盘就是破坏整个阵列。
7.磁盘掉线
对于RAID5来说,掉线1块盘阵列还是可以正常运行的,如果超出1块,阵列将无法启动。当阵列掉线超出1块盘的时候,最好不要做强制Online。尤
其是在你不知道是哪个盘先掉线哪块盘后掉线的时候,绝对不可以强制Online。RAID0和1算法简单,这里就不详细说明了。RAID5当一块硬盘
OFFLINE之后负载会比较重,此时最好做脱机的REBUILD,如一定要在线REBUILD,应尽可能少得对磁盘做高负荷的读写,应保障这个过程的顺利完成。建议条件许可的话,加入HOTSPARE
DISK
8.磁盘有坏道
阵列中的磁盘如果有坏道的话,会导致磁盘掉线或阵列不稳定,这时应尽早将有坏道的硬盘换掉,如果出现多坏硬盘有坏道的话,阵列将可能瘫痪。
评论