信息消除
当前位置:首页 > 业内新闻
业内新闻
磁盘阵列智能存储数据恢复技术研究
发布时间:2015-08-23 09:19:23     发布者:技佳数据恢复中心     --转载请注明出处--
1、传统Raid数据恢复的局限性
       Raid全称Redundant Arrays of Independent Disks,即“独立冗余磁盘阵列”,是用多块硬盘通过一定手段组合成一个完整硬盘来使用的技术。常见的Raid组合手段有以下几种:
Raid级别 Raid-0 Raid-1 Raid-10 Raid-5 Raid-6
别名 条带 镜像 镜像条带 分布式奇偶校验条带 分布式双校验条带
容错性
冗余类型 复制 复制 奇偶位 奇偶位
所需磁盘数 至少2块 有且只有2块 至少4块 至少3块 至少3块
可用容量 磁盘总容量 磁盘总容量的50% 磁盘总容量的50% (N-1)/N的磁盘总容量 (N-2)/N的磁盘总容量

      Raid出现故障时,通常由于阵列中的一块或几块硬盘出现物理损坏而离线,导致Raid机制丧失,从而造成数据丢失。针对Raid阵列进行数据恢复,最常用的传统手段是:
      第一步:将阵列上全部成员盘按顺序取下,并一一编号,对离线硬盘进行特殊标记;
      第二步:检测并处理离线硬盘故障,对其进行完整的磁场克隆;
      第三步:用完好的成员盘与故障硬盘的克隆盘一起虚拟重组,将数据提取至事先准备好的数据拷贝盘中。
      这种恢复方式的局限性在于:
      (1)仅适用于非智能存储。传统存储模式由于存储效率和稳定性存在瓶颈,IBM、惠普等存储厂商已推出多种智能存储,以提升存储的效率及稳定性,而智能存储的存储机理完全不同于传统模式,传统恢复手段中采用的虚拟重组技术也就失效了。
      (2)仅适用于小容量存储。目前智能存储的容量动辄几十TB甚至上百TB,很难找到匹配容量的数据拷贝介质。另一方面,即使可以通过传统方式进行恢复,数据拷贝过程也需要耗时几周甚至几个月,而数据恢复是一项应急服务,恢复周期越长,数据的价值就越低。
      (3)仅适用于磁盘数量较少的存储。智能存储中,硬盘数量通常为几十个,大型存储可达上百个,以目前的恢复设备,难以同时接入如此数量的硬盘,数据恢复也就无从谈起。
2、大数据推动智能存储的普及
      互联网已进入“云时代”,“云”的核心是海量数据的存储和管理,所以它需要配置容量巨大、性能优异的大型存储,这是传统存储达无法实现的。为了推动云的发展,惠普、IBM等存储厂商已推出多种智能型存储,目前,大型智能存储已广泛应用在科研、军事、医疗、网站等大数据行业和领域。
3、存储算法更新换代
      相比于传统存储,智能存储模式更加灵活、容灾机制也更完善,同时,为了提高运行效率,智能存储还引入了“存储池”、“虚拟磁盘Mdisk”等概念。图1为传统存储和智能存储的区别,由图可见,二者有着完全不同的数据存储结构,数据经由智能存储的存储池后,结构已经发生变化,最终存储到磁盘里的数据已无规律可循,依照传统方式进行恢复是不可行的。
传统存储和智能存储的区别
 
图1 传统存储与智能存储区别

      理论上,存储是通过磁盘的SN号、微码程序等信息来关联每一个成员盘,如果此时将其中某一块硬盘替换,存储会将其标记为“外来硬盘”而拒绝让其加入Raid中,而存储所依据的标准就是磁盘的SN信息。当存储中某一成员盘发生故障,存储会记录该硬盘的信息并将其置为离线状态,如果通过将故障硬盘克隆至同型号新硬盘中,并研究某种技术手段来修改新硬盘相关的硬件信息,将其“伪装”成原硬盘,然后在存储中强制上线,那么理论上,存储就能重新正常工作了。这一理论一旦实现,将极大提高Raid数据恢复的效率和成功率。

联系我们 |  关于我们 |  网站地图
北京技佳瑞康科技发展有限公司  版权所有  Copyright @ 2012-2021
Beijing DataBack Technology Development Co.,Ltd. All rights reserved.

公网安备:11010802013182号 工信部备案:
京ICP备13032780号