在灾难恢复方面,目前业界公认有三个目标值得努力。一是恢复时间,企业能忍受多长时间没有 IT,处于停业状态;二是网络多长时间可以恢复;三是业务层面的恢复。整个恢复过程当中,最关键的衡量指标有两个:一个是 RTO,另外一个是 RPO。html
所谓 RTO,Recovery Time Objective,它是指灾难发生后,从 IT 系统当机致使业务停顿之时开始,到 IT 系统恢复至能够支持各部门运做、恢复运营之时,此两点之间的时间段称为 RTO。网络
所谓 RPO,Recovery Point Objective,是指从系统和应用数据而言,要实现可以恢复至能够支持各部门业务运做,系统及生产数据应恢复到怎样的更新程度。这种更新程度能够是上一周的备份数据,也能够是上一次交易的实时数据。ide
对灾难恢复而言, RTO 与 RPO 哪一个衡量指标更合适呢?
在考虑采用哪一个指标以前,IT 人首先要弄清楚一个基本概念,企业的容灾系统预防的是什么灾害,是多少年一遇的,能忍受多少损失,须要算出一个大概的成本,固然不必定很精确。
其次,不管企业容灾系统是采用冷备、热备、温备、仍是磁盘备份,几分钟恢复业务和几天恢复业务效果是彻底不同的。企业须要明确对恢复时间的容忍底限是多少。
再从灾备自己的意义来说,不管采用哪一种衡量指标,最终目的是要可以很好地检验灾备系统的实用性能,不然就失去创建灾备的意义了。而灾备最核心的做用就是确保灾难发生后业务可以连续运行,交易中的数据完整保存,丢失越少越好。所以业务层面的恢复,企业要有一个底限。
参考世界范围内一系列灾难恢复经验,国家之间的差异很是大。好比在美国,政府是第一位的,警察局对数据的恢复要求特别高。而在中国,不管什么性质,银行始终是排在第一位的。性能
做为银行,除开展自身业务以外,更多数据来自上下级银行间的财务汇兑与结算。站在管理者的位置上,一旦灾难发生,最重要的是在尽量短的时间内排除障碍,恢复业务,保证系统作到连续运行。所以,从这个角度出发,银行允许系统停滞的时间应当越短越好。选择 RTO 恰好合适。htm
可是,RTO 对成本要求过高,与回报彷佛不成正比。企业资金不可能无限制地投入到一个灾备系统中。对于银行证券这样的联机交易事故处理很是紧密的金融机构而言,可能每一笔、每一单、每一分钱都很重要,因此都须要恢复。RPO 显然更为合适。对象
许多时候进行选择并不意味着非此即彼,这与现实婚姻中一夫一妻的限制仍是有差异的。RTO 和 RPO 对银行来说都很重要。RTO 越短、RPO 越新,银行面临的损失就越小,但这也意味着系统开发成本将会急剧上升。许多时候,最佳的容灾解决方案却不必定是效益最好的。反之亦是。如何去平衡这中间的关系,不只是门学问,更像是艺术。
根据国际经验,在选择“你”仍是“她”的时候,企业应当考虑灾难发生后会在多大层面上冲击业务,这涉及到企业形象,商业机密,信誉评级,品牌竞争力等等方面,各个企业的状况不一样,要根据本身的状况选择合适的“对象”。灾难恢复的目的是业务连续进行,所以不管采用 RTO 仍是 RPO,都要朝着这个核心靠拢。blog
本文转载自:http://blog.sina.com.cn/s/blog_59388e440100oq52.html
开发