数据同步之大数据下数据仓库的同步方式

数据仓库的特性是集成,把不同数据源、不同形式的数据整合在一起。大数据下的数据特点如下: ①数据多样性:包括高度结构化,易于处理的结构化数据以及服务器日志、图片、视频等非结构化数据 ②数据量:传统的数据仓库每天的同步量在几百GB上下,大型的数据仓库每天达PB级别,甚至EB级别 批量数据同步: 1)离线的数据线仓库用于负责将不同数据源的数据同步到数据仓库,以及定时将数据同步到业务系统 2)要实现不同数
相关文章
相关标签/搜索