据统计,截至2015年,全球数据总量已近10ZB(10万亿GB),并且仍在以每18个月翻一倍的速度在急速增长。对于硬件存储介质,主流机械硬盘容量已进入TB级,闪存容量最高也达到16T的水平。另一方面,我们看到的是介质质量的急剧下滑,我们就在这种的矛盾中迎来了
大数据时代。
从数据产生,我们的数据安全就面临两大威胁:数据丢失和数据泄漏。我们站在专业
数据恢复公司的角度,针对数据丢失,与大家探讨一下数据安全与数据救援。
1、数据安全威胁(哪些因素可能威胁到我们的数据安全)?
(1)人为失误:由于人为误删除、误格式化、或者一次对随意的热插拔导致分区损坏造成的数据丢失
(2)介质故障:由于介质正常、非正常老化导致的其无法正常工作,数据无法读取
(3)恶意破坏与窃取: 1)病毒破坏、木马程序、黑客入侵等恶意手段窃取与破坏 2)
数据恢复过程中不法从业者的非法窃取 艳照门事件 第一次让数据隐私和数据安全成为一个公众话题,为人们所重视。
(4)意外事故与自然灾害: 火灾洪水等引起的数据丢失,每次重大自然灾害之后,都会有大量数据丢失案例的发生,远的有2012年北京暴雨,近的有2015年东方之星号沉船事件。
2. 所有这些因素,都在威胁我们的数据安全,让我们在大数据时代面临着巨大数据丢失的风险。这些故障以一种什么样的比例在发生呢?
按照数据丢失的发生原理,我们把数据丢失按照逻辑故障、硬件故障、服务器故障分为三类。诸如删除、格式化类的逻辑故障每时每刻都在发生,而服务器由于完善的冗余机制,使其具有较高的容灾能力。据统计,这三类故障的自然发生率接近金字塔分布。即逻辑故障最多、物理故障次之、服务器故障最少。
但是根据
数据恢复恢复中心统计的实际送修案例,这个数值是有出入的,逻辑故障的实际送修率并未高于物理故障,并且近两年有不断下降的趋势,而硬件故障率却在不断提升。
针对这种情况,我们分析了近几年这三类故障的发展趋势:
(1)逻辑故障
1)自然发生率升高,但送修率下降 随着共享类逻辑恢复软件的普及,
数据恢复行业变得日益透明,简单的逻辑故障用户通常可以自我尝试解决,而对于重要性不高的数据,用户在衡量时间成本和金钱成本后,可能选择放弃。
2)恢复难度增加:正是基于第一点,简单的故障用户自我解决,那么留给专业工程师的故障难度就在增加,用户不专业的操作,给数据造成二次破坏,进一步增大了数据恢复难度。
3)邮件、数据库类故障增加:这两类故障通常用户无法自我恢复,只能求助专业恢复机构进行恢复。
(2)物理故障
一方面我们看到的是大幅提升的磁盘容量,随着第六代垂直记录技术的应用,机械硬盘存储密度已经达到单碟1T,整盘4T的水平。而固态硬盘经过几年的发展,最大容量也达到756GB,另一方面,我们看到的是急剧下降的硬盘质量,10年前的Maxtor硬盘可能现在还在服役,但现在的硬盘很多在几个月内就结束了生命周期。我们的数据安全就在这一矛盾的对立中失去了平衡。据我们统计,由于介质正常或非正常老化造成的数据丢失已占到所有故障的60%左右。
(3)服务器故障
1)装机量增加,2011年中国服务器装机量就已经达到180万台,这是一个非常巨大的数字。
2)安全机制加强,通过不断完善的RAID冗余机制,服务器安全性能得到进一步提升。
3)故障量在增大,故障难度增加。这是1和2的必然结果,基数增大必然导致故障数量增加,2为什么会导致故障量在增大,服务器提供商通常会着力强调其产品的安全性,但这一安全性是建立在磁盘质量过硬的前提下,而他们过于强调这一安全性,反而使机房管理人员放松了警惕。举一例子,raid-5通常的故障表现为2块硬盘离线,由于第一块离线时,未被及时发现,当第二块离线导致raid机制破坏,服务器宕机后才发现,而在故障发生后,盲目采取的补救措施反而加剧了故障的严重程度。