详解大数据数据仓库分层架构

转自:http://blog.csdn.net/kwu_ganymede/article/details/51367422 大数据数据仓库是基于HIVE构建的数据仓库,分布文件系统为HDFS,资源管理为Yarn,计算引擎主要包括MapReduce/Tez/Spark等,分层架构如下: 1、数据来源层:日志或者关系型数据库,并通过Flume、Sqoop、Kettle等etl工具导入到HDFS,并映射
相关文章
相关标签/搜索