数据管理的智能趋势(4):保护与成本的两面性

做者:崔昊 - DOIT传媒执行总编,七年IT媒体从业经验,关注服务器、存储和信息化领域 php

数据普遍存在于企业的IT系统中,是企业发展的核心,一切的IT系统发展都有赖于数据,并服务于面向企业业务的数据管理需求。随着IT行业的发展以及企业对数据管理要求的不断进步,数据管理的“智能”趋势已经锐不可当,智能的数据管理正在成为全部企业所追求的共同发展目标。web

本文是《数据管理的智能趋势》系列文章的第四篇,在本篇文章中,您将了解到,保护与成本的两面性体如今何处,如何利用更轻松的方法巧妙地化解数据保护与支出成本之间不断增加的矛盾。此外,咱们还将在本文中,为您讲述多代数据保护、低成本的长期保护及创新的对象保护等兼具数据保护需求与成本效益的方法,如何构建智能数据管理中相当重要的数据保障。安全

 

而在下一篇文章中,咱们将重点介绍“面向将来的数据管理”,帮助您了解,将来的数据将是不断流动的,而技术也将在数据的流动中不断发展。同时,下一代数据中心技术,包括存储、服务器及网络技术,将带来怎样的对于数据管理的变革,智能数据管理又为什么成为将来数据管理的坚实基础和可靠保障。服务器

数据保护是数据管理中不得不面对的一个问题,良好的保护——让数据不存在丢失、损坏或是泄露,保证数据的“完整的存在”——是数据管理的核心议题,同时,也是数据管理的管理行为中,最为基本的工做。没有数据,何谈管理?网络

当今的公司、企业和组织,甚至是每一个人,都意识到了数据丢失的威胁和后果,到目前为止,大部分公司都采起了某种形式的数据保护。可是,那些担忧丢失重要信息资料转而涌入数据保护行列的公司可能太过急于求成地将将各类软件、系统或是解决方案东拼西凑起来,如今证实这样的举措付出的代价是高昂的。架构

图释:做为数据保护的重要手段,备份恢复和灾备现在都是CIO们关心的话题,可是本地系统的数据保护若是还未理顺,何谈灾备?app

 

图释:从TheInfoPro存储研究的报告中咱们可以了解到,大部分CIO都明白,好的数据保护是企业的数据存储关键点,但这个调查结果也显示出,用户对于数据保护的要求是复杂且多种多样的,传统的、线性的保护已经不可以知足用户的需求,用户须要智能数据管理。ide

在急于获取数据保护的潮流中,不少企业疯狂地未来自不一样厂商的技术拼凑在一块儿,然而却忽视了软件集成和政策等问题。因为担忧没法应对数据丢失问题,数据保护工做被仓促上马,从而致使其缺少规划和技术实施的处理过程。如今,他们不得不留下来收拾残局。工具

更糟糕的是,那些还没有实施数据保护技术的公司看到了其它组织在数据保护难度和成本方面碰钉子,并打算开始评估这一风险等式。最终,常见的状况是,他们愿意承担缺少数据保护的风险,而且也愿意面对潜在的数据反串所产生的后果和成本开销,而不肯意去执行那些他们以为费用昂贵且复杂的数据保护解决方案。性能

但事实上,数据保护工做所须要实现的效益和所须要付出的成本,是可控并能够接受的,同时,良好的软硬件结合的数据保护解决方案,可以很好的保护数据使之达到知足服务水平管理协议(SLA)的要求,为进行智能数据管理提供坚实的数据基础。

同时,数据保护的需求正在多样化,除了保证数据不损坏、丢失和泄露以外,下降长期保护的成本、经过数据保护保证在线系统性能、为在线系统的运营数据提供有效保护、法规听从都是“必须同时”而非“随时可选”,企业用户须要更智能的数据保护。

数据保护与成本的两面性:更好的保护是否意味着更贵的成本?

大多数的企业、组织、公司认为,更好的数据保护意味着更贵的成本,只有花更多的钱,才可以得到更好的数据保护,事实倒是,得到最高级别的数据保护并不是必定须要不菲的花费。

良好的数据保护来自于三个方面:一是高度的认知程度与警戒意识;二是针对重要程度不一样的数据采用不一样的数据保护方法;三、创建良好的数据保护策略与数据保护的管理方法。只要作到这三点的基本要求,得到高水准的数据保护同时兼顾较低的成本,并不是不可能。

时至今日,咱们仍然遗憾的看到,许多企业表示对于哪些信息须要保护感到毫无头绪,并且据AIIM-The ECM Association的调查显示1,大部分企业都不知道若是不保护好本身的信息可能会带来什么样的潜在成本。

AIIM公司市场信息副总裁Carl Frappaolo认为:“人们几乎都不肯意在内容保密上花太多的时间和金钱,由于人们老是天真地认为若是咱们历来都不会遇到那种事情,咱们就没必要老是担忧它会发生。”但事实是,这些被调查人群中的许多人随后都发现,企业中的信息丢失、损坏或是干脆被删除了。对数据保护的重视程度,是数据保护的基础之一。

具备较高成本效益的数据保护的基础是考虑数据的重要程度和特性,以早期的系统保护方式:高可用性双机热备(高可用集群,HA)为例,HA须要两套彻底相同的硬件设备并得到相同的软件受权,两套系统互为备份,同一个I/O发往两个设备但只返回一个结果——由于其中一台并不是在线模式而是离线模式,准备在另一台系统宕机的时候随时接管业务——但会有CIO在全部的业务中都采用HA吗?答案显然是否认的,道理很简单:HA让系统成本翻了一番,若是咱们以一样的模式思考数据保护,这其中的问题就是,全部的数据都须要花费不菲得到最顶尖的保护么?

数据的重要程度和特性的变化,表如今成本的投入上,越是重要的数据投入越大,通常的数据,尤为是长期不访问的数据,磁带等更低成本的解决方案会更加行之有效。最重要的是,节省了大量成本。

之因此说智能数据管理是将来的趋势,正是由于其在保护数据时,首先考虑到了数据的重要程度。

智能数据管理在保护数据时根据不一样的应用级别保护数据,以不一样的成本去保护数据,并根据其重要程度,在相对应的成本下,选择不一样的数据保护策略和方式,这是一个避免“捡了芝麻丢了西瓜”的重要守则,让有限的成本投入到最须要高等级保护同时也是最重要的数据上去。这是智能数据管理对数据保护的首要要素:按照重要程度分类数据,并以重要程度为标准投入对应的数据保护成本。

在智能数据管理的理念下,数据保护采用了根据业务系统所搭载的业务应用级别不一样,如业务量、重要性、相应级别、恢复宕机等方面要求,投入不一样成本进行保护的模式——不是全部的业务应用,都具备相同的RTO(恢复时间目标)和RPO(恢复时间点目标)指标,以电信行业为例,核心的计费BOSS系统和并不经常使用的通知下发平台的RTO和RPO就必然不一样。

此外,数据又拥有结构化/非结构化、长期保存/短时间保留等不一样的特性,数据保护也必需要考虑到这一个方面。

在智能数据管理体系中,不一样类型的数据、不一样的保护周期都有适合的数据保护架构,如长期的、对象化的、须要具备法规听从的一次写入不得更改功能的数据,就不适合常规的磁盘备份、虚拟磁带库或是磁带库,而更适合相似戴尔DX存储这样的对象存储系统。这样的数据保护机制,其根基是对数据特性、数据生命周期(除了法规监管的需求外,是否某些数据其实能够被删除?如临时文件)问题的深入认识。这也是智能数据管理的数据保护机制更加优异的缘由:数据依照其特性而被量身定作的保护。

固然,创建良好的数据保护策略与数据保护的管理方法是最后的“上层建筑”,一方面,在虚拟化时代来临的今天,虚拟化时代的数据保护和物理时代的数据保护有显著的不一样;另外一方面,不一样的备份、恢复、归档等数据保护策略,如增量备份、全备份、差别备份、磁带归档、磁盘备份等不一样的方式方法,将显著的影响成本和数据保护的能力。

无缝扩展对数据保护的意义

在以前的三篇文章中,咱们屡次谈到了戴尔Compellent和EqualLogic存储系统,并介绍了其无缝扩展技术,解释了这项技术在企业的数据管理、存储系统扩展及虚拟化环境变革方面所带来的受益,在数据保护的话题上,咱们一样可以看到这项技术所焕发的光彩。

无缝扩展技术的实现,在数据保护层面具备极大的意义,在过去,企业每次购进新的存储系统,都要作两件事情:一、进行数据及应用迁移;二、更换新的数据管理应用程序。

这两项工做所蕴藏的风险很是之大,数据迁移可否成功,新存储系统可否无缝的、平滑的把应用从旧有的系统接管过去,存在着极大的不肯定性;新的数据管理应用程序,可否很好的适应现有的应用系统及数据保护策略?

 

 

图释:Compellent采用按需扩展的单一平台,保证数据不会由于系统扩展和升级,遇到保护方面的问题。

没法支持无缝扩展的存储系统,将逼迫企业的应用人员从新进行培训所花费时间和金钱即使忽略不计,更换新的管理方式后所形成的人员生疏,从而致使人工错误大幅度上升,这几乎没法避免。

无缝扩展在数据保护层面具备极大的意义,一、它解决了企业须要对存储系统、数据管理方式进行更迭、迁移的现状,不只省却了大量的时间,而且杜绝了数据和管理策略在不一样系统中不断变换的风险;二、无缝扩展保证了多代系统都可以良好的接管数据和信息管理,前代的数据格式、管理方式以及数据自己可以很好的被继承下来——就像是咱们以前举过的例子,数据就像是货币同样,长久可用,“银行(数据系统)”所作的升级不对其形成任何影响。

 

图释:分层技术不只能减小数据存储的成本,将不一样重要性的数据存放在不一样的介质上,大幅度提高系统性能的同时,减小了在线存储系统(Tier0、Tier1层)的负担,减小系统中可能发生的热区(Hot Area)自己对系统也是一种保护。

此外,咱们在以前的文件中介绍的自动分层技术,一样在数据保护领域有所功效。其呼应了上面所提到的“针对重要程度不一样的数据采用不一样的数据保护方法”,在SATA、SAS、FC、SSD等多种磁盘混合的存储系统,实现自动的分层存储,将生产数据放置在高速的SSD或15k rpm的SAS、FC磁盘上,而将较少访问须要I/O性能较低的数据放在更为低廉的大容量SATA或NL-SAS上,自己就是在生产系统上进行了更具成本效益的数据保护。

此外,在磁盘阵列、磁盘备份系统、虚拟磁带库系统(VTL)、磁带存储系统及对象存储等多种架构的系统中实现分层存储,也是经过对数据的重要程度和须要的可访问性进行分层,实现的更具成本效益的数据保护。

低成本的长期保护与创新的对象存储

上面咱们提到,须要经过对数据的重要程度和须要的可访问性进行分层,实现的更具成本效益的数据保护,这意味着咱们不只须要面对一些“即时可用”的数据进行保护,也须要对一些“长期需用”的数据进行保护——长期的数据保护必然须要更低的成本。

首先,咱们就须要了解如何以较低的成本,长期的进行数据保护。戴尔与赛门铁克、CommVault两家数据管理、备份恢复与归档平台供应商合做的PowerVault DL2200是一个能够参照的样本,咱们能够看到,从PowerVault DL2200+赛门铁克、CommVault的方案上,

咱们看到了两个须要注意的词汇,一个是重复数据删除,一个是虚拟磁带技术,这两项技术对于长期的数据保护来讲,具备极高的成本效益:重复数据删除将清除掉大量冗余、重复的数据,减小长期须要保护的数据量;虚拟磁带技术则以磁盘系统模拟磁带输入输出及磁带格式,可以减小对现有的、每每是五年、十年或更长期的基于磁带的数据保护架构的“破坏”,造成平滑的数据保护接入。

减小数据量、根据现有的架构调整数据保护模式,智能数据管理的理念贯穿始终,而对于更为长期的,并须要符合法规听从——咱们在以前的文章中提到过,智能数据管理的其中一个话题就是智能的符合法规听从要求——的数据而言,新的对象存储模式则提供了极高的可用性,能够做为长期的、对法规听从有须要的数据保护要求的参照产品。

此外,对象存储也是一个长期保护的好办法,它是继块、文件访问以后新的存储底层访问架构模式,专为智能访问、存储、保护和分发固定数字内容而设计, 其具备如下特色:一、通常采用即插即用式架构,以及自我愈合和自我复制技术,可以有效地下降存储平台的管理成本和复杂度;二、可以打破传统文件系统之间的屏障,一个存储集群可以容纳无限数量、大小的文件或原始容量;三、对象存储平台可以让用户将固定的、非事务性的内容迁移到一个新的存储层,可以使SAN或网络附加存储部署规模更小,占用资源更少,从而下降管理与支持成本。

戴尔在去年推出了其自主设计研发的DX对象存储系统,在部署的过程当中无需配置LUN,无需进行其它设置,可以真正作到即插即用。同时,戴尔DX对象存储平台不管是在容量上仍是数据吞吐量上,都能实现轻松高效的扩展。

重要的是,在扩展戴尔DX对象存储平台容量时,用户无需中断正常的系统服务,就能进行无缝的扩展,而且这种扩展对文件系统的类型,文件的数量和大小,都没有限制,并且随着存储节点的增长,整个系统的吞吐量也会同步提高——若是这称不上是智能数据管理?那么,咱们还须要什么样的智能?

虚拟化为数据保护带来全新挑战

事实上,不少的企业也遇到了虚拟化时代数据保护的困难,据资料显示,Veeam调查了位于美国、英国、德国和法国的员工人数超过1000人的公司,访问了500位首席信息官2,发现44%的首席信息官表示在一些任务关键型工做负荷上会避免采用虚拟化,由于他们担忧虚拟化会影响备份和恢复。许多公司只备份三分之二的(68%)的虚拟化数据。61%使用物理手段来进行备份和恢复的企业从如今开始会针对虚拟化改变他们的数据保护方式。

此外,63%的回答者使用单一产品来同时备份他们的物理和虚拟服务器。在这种方式下,他们仍然视虚拟机为物理服务器,于是限制了虚拟化的使用程度。所以,这些企业在虚拟化的任务关键型工做负荷上没有获得应有的最佳的保护水平。

传统的在物理时代保护数据的方式,在虚拟化时代也被认为是不可取的,在被问到关于在虚拟环境中使用传统基于物理的备份工具的缺点时,超过一半的回答者(51%)指出这种方式太昂贵。除了这个,40%的回答者指出恢复速度太慢,还有40%的回答者指出缺点是须要安装软件代理。

随着大多数部署了虚拟化的企业的CIO明白,对于虚拟环境的数据保护,成功的关键决不是对传统备份手段加以调整就能够知足需求,企业的管理者们开始寻找新的方法,如利用VMware所提供的VAAI、VASA等API及微软Hyper-V的API进行数据的备份、恢复和归档,但最重要的是,“须要一颗虚拟化的‘心’”——正如以前一篇文章所说,Compellent和EqualLogic及戴尔的存储系统,都已是“Virtualization Ready”的。

新观点:在线系统处于数据保护前沿

是否只有备份恢复、归档、对象存储、虚拟磁带库这些名词与数据保护有关,对于处于生产系统前沿的主存储系统而言,数据保护是否与其造成了自然的隔绝呢?数据保护是否只是针对将“数据静态的保护起来”,而处于流动状态的数据信息,是否就只可以依靠硬件系统的可靠性来获得最基本的保护?

智能数据管理提出了一个新的观点,那就是“在线系统(Tier 0、Tier 1层的主存储系统)处于数据保护的前沿”,在线存储系统如EqualLogic、Compellent在保护数据的可靠性、可用性和安全性上,一样应当作足功课。

在这个观点看来,做为数据的发源地及数据生命周期最开始的地方,在线主存储系统应当具备更好的保护数据的能力,作到让数据合理、快速、完整的进入到数据保护中后期流程中。

图释:EqualLogic的脱机主机备份(Server Free Backup)结合戴尔PowerVault DL2200和磁带库,构成了具备成本效益的可以快速实施的方案,保证数据自服务器系统一经出现,直到最后归档的全过程的保护。

主存储系统首先应具有更好的支持备份恢复、灾难恢复的系统的能力,协助加快备份恢复和归档的速度,支持CDP(持续数据保护)技术的整合应用;其次,要可以经过Snapshot(快照)、Clone(克隆)、Replication(复制)等技术,提供对在线运营数据的良好保护。同时,这些操做应当是自动化、智能化的,减小人工干预的成分存在。

这一观点的提出,不尽扩展了智能数据管理理论在数据保护范畴内的应用,同时也完善了数据生命周期的生产/在线周期内的数据保护工做的思路。

总结:数据保护与成本可以兼得

综上所述,知足需求的数据保护与合理的支出成本是能够兼得的,有轻松的方法巧妙地化解数据保护与支出成本之间不断增加的矛盾——多代数据保护、低成本的长期保护及创新的对象保护等兼具数据保护需求与成本效益的方法——实现了这一用户的夙愿,数据保护并不是昂贵和复杂的,低成本、简单易用、长期有效,经过合理的方法均可以获得。

下一篇文章《数据管理的智能趋势(5):面向将来的数据管理》将是本系列的最后一篇文章,在最后的一篇文章中,咱们最后将为您介绍为何智能的数据管理已经成为将来的数据管理发展方向之一,以及数据管理技术的演进;为将来准备就绪且知足革新的系统升级理念的存储系统究竟是什么样子?将来的数据管理又须要哪些必须的保障?敬请期待。

相关资料:

1 AIIM-The ECM Association,位于欧洲的调查分析公司

2 《Executive Brief on VMware Backup and Recovery Curtis Preston》 , Veeam Software ,2010年

 

全部文章:

数据管理的智能趋势(1):在数据世界迎接智能数据管理理念

数据管理的智能趋势(2):如何实现高效的数据管理

数据管理的智能趋势(3):存储虚拟化与虚拟环境下的数据管理

数据管理的智能趋势(4):保护与成本的两面性

数据管理的智能趋势(5):面向将来的数据管理

更多精彩文章请关注:

戴尔技术社区

相关文章
相关标签/搜索