Airbnb开源ReAir工具,提供PB级数据仓库的迁移和备份

摘要:本篇讲述Airbnb的开源ReAir工具,提供PB级数据仓库的迁移和备份。 Airbnb大数据平台架构成为Airbnb公司提升产品决策的关键部分。其Hive数据仓库从2013年中旬的350 TB暴增到11 PB (2015年末统计的数据)。随着公司的成长,数据仓库的可靠性需求日益剧增。我们寻求迁移数据仓库,但现有的迁移工具要么在大数据仓库时有问题,要么就是有很明显的操作负荷,所以Airbnb
相关文章
相关标签/搜索