在6月上旬举行的云栖大会上海峰会上,阿里云发布了国内首个大数据集群双活容灾产品-混合云容灾服务下的混合云大数据容灾服务(HDR for Big Data, 简称 HDR-BD),并已经在7月份开始邀测。HDR-BD采用业界领先的数据双向实时复制技术,能够实现Hadoop集群双活和准0 RPO容灾,为大数据灾备制定了全新的标准。服务器
常见Hadoop灾备技术的挑战架构
当前比较常见的Hadoop集群灾备方式是用distcp将数据按期复制到一个备用集群作容灾用途,或者将数据复制到只读集群、二级存储做为多恢复点的备份。这些方案都有明显弱点。运维
RPO和RTO是衡量灾备方案的两个重要指标,RPO-恢复点目标,决定了丢失多少数据,RTO-恢复时间目标,决定了业务中断了多长时间。因为传统的Hadoop集群灾备方式使用的是distcp来作容灾,也就意味着数据复制不是实时的,所以用户必须承受至少小时级到天级的RPO。而且主站宕机后,将只读集群或二级存储中的数据恢复出来会占用大量时间,而拉起standby集群从新启动业务依然是一个耗时的操做。所以,传统的Hadoop集群灾备方式在RPO和RTO方面都有较大挑战。tcp
除此以外,因为灾备集群平时处于备用状态,不能用于运行业务,对于用户来讲也属于资源浪费。oop
以上这些问题长期困扰着Hadoop集群的用户和管理员们,如何突破RPO和RTO瓶颈,大数据集群的灾备领域亟需一种全新的技术来完全解决目前的困境。大数据
HDR- BD这次带来的双向实时复制技术能够在两个Hadoop集群之间创建双活架构,RPO接近0;RTO由于数据随时可读写而极大压缩;双活架构可让两个集群运行不一样的应用,避免资源浪费。这些特性将Hadoop灾备标准提升到了一个全新的高度,为Hadoop用户带来了极高的价值。阿里云
HDR-BD引入大数据双向复制技术,知足高要求的大数据灾备场景对象
阿里云这次推出的Hadoop双活容灾方案HDR-BD引入了业界领先的大数据双向复制技术,结合强大的公共云基础设施,能够知足极高要求的大数据灾备场景,为企业Hadoop集群数据保护提供了全新的选择。
HDR-BD的优点在于:blog
在自建数据中心和阿里云之间部署HDR-BD服务器配对,用户就能够将自建Hadoop集群与阿里云无缝集成,充分利用阿里云EMR和OSS创建极为高效的Hadoop灾备,迁移系统。HDR-BD能够知足的核心场景包括资源