1、传统Raid数据恢复的局限性
Raid全称Redundant Arrays of Independent Disks,即“独立冗余磁盘阵列”,是用多块硬盘通过一定手段组合成一个完整硬盘来使用的技术。常见的Raid组合手段有以下几种:
Raid级别 |
Raid-0 |
Raid-1 |
Raid-10 |
Raid-5 |
Raid-6 |
别名 |
条带 |
镜像 |
镜像条带 |
分布式奇偶校验条带 |
分布式双校验条带 |
容错性 |
无 |
有 |
有 |
有 |
有 |
冗余类型 |
无 |
复制 |
复制 |
奇偶位 |
奇偶位 |
所需磁盘数 |
至少2块 |
有且只有2块 |
至少4块 |
至少3块 |
至少3块 |
可用容量 |
磁盘总容量 |
磁盘总容量的50% |
磁盘总容量的50% |
(N-1)/N的磁盘总容量 |
(N-2)/N的磁盘总容量 |
Raid出现故障时,通常由于阵列中的一块或几块硬盘出现物理损坏而离线,导致Raid机制丧失,从而造成数据丢失。针对Raid阵列进行数据恢复,最常用的传统手段是:
第一步:将阵列上全部成员盘按顺序取下,并一一编号,对离线硬盘进行特殊标记;
第二步:检测并处理离线硬盘故障,对其进行完整的磁场克隆;
第三步:用完好的成员盘与故障硬盘的克隆盘一起虚拟重组,将数据提取至事先准备好的数据拷贝盘中。
这种恢复方式的局限性在于:
(1)仅适用于非智能存储。传统存储模式由于存储效率和稳定性存在瓶颈,IBM、惠普等存储厂商已推出多种智能存储,以提升存储的效率及稳定性,而智能存储的存储机理完全不同于传统模式,传统恢复手段中采用的虚拟重组技术也就失效了。
(2)仅适用于小容量存储。目前智能存储的容量动辄几十TB甚至上百TB,很难找到匹配容量的数据拷贝介质。另一方面,即使可以通过传统方式进行恢复,数据拷贝过程也需要耗时几周甚至几个月,而数据恢复是一项应急服务,恢复周期越长,数据的价值就越低。
(3)仅适用于磁盘数量较少的存储。智能存储中,硬盘数量通常为几十个,大型存储可达上百个,以目前的恢复设备,难以同时接入如此数量的硬盘,数据恢复也就无从谈起。
2、大数据推动智能存储的普及
互联网已进入“云时代”,“云”的核心是海量数据的存储和管理,所以它需要配置容量巨大、性能优异的大型存储,这是传统存储达无法实现的。为了推动云的发展,惠普、IBM等存储厂商已推出多种智能型存储,目前,大型智能存储已广泛应用在科研、军事、医疗、网站等大数据行业和领域。
3、存储算法更新换代
相比于传统存储,智能存储模式更加灵活、容灾机制也更完善,同时,为了提高运行效率,智能存储还引入了“存储池”、“虚拟磁盘Mdisk”等概念。图1为传统存储和智能存储的区别,由图可见,二者有着完全不同的数据存储结构,数据经由智能存储的存储池后,结构已经发生变化,最终存储到磁盘里的数据已无规律可循,依照传统方式进行恢复是不可行的。
图1 传统存储与智能存储区别
理论上,存储是通过磁盘的SN号、微码程序等信息来关联每一个成员盘,如果此时将其中某一块硬盘替换,存储会将其标记为“外来硬盘”而拒绝让其加入Raid中,而存储所依据的标准就是磁盘的SN信息。当存储中某一成员盘发生故障,存储会记录该硬盘的信息并将其置为离线状态,如果通过将故障硬盘克隆至同型号新硬盘中,并研究某种技术手段来修改新硬盘相关的硬件信息,将其“伪装”成原硬盘,然后在存储中强制上线,那么理论上,存储就能重新正常工作了。这一理论一旦实现,将极大提高Raid数据恢复的效率和成功率。