详解大数据数据仓库分层架构

大数据数据仓库是基于HIVE构建的数据仓库,分布文件系统为HDFS,资源管理为Yarn,计算引擎主要包括MapReduce/Tez/Spark等,分层架构以下:前端 一、数据来源层:日志或者关系型数据库,并经过Flume、Sqoop、Kettle等etl工具导入到HDFS,并映射到HIVE的数据仓库表中。数据库 二、事实表是数据仓库结构中的中央表,它包含联系事实与维度表的数字度量值和键。事实数据表
相关文章
相关标签/搜索