我理解的数仓项目

我理解的数仓项目 我会从数据的流向来梳理整个架构.前端 离线数仓:(对产生的数据进行处理,通常处理T+1数据.)mysql 订单数据保存在mysql数据库中,经过kettle进行ETL (进行数据的抽取,基本的预处理 转换装载到HDFS中)web 这里用到hive数据仓库工具,hive 数据保证在hdfs中,运用hsql对数据进行操做, 底层进行mapreduce.redis 对数仓进行分层.sq
相关文章
相关标签/搜索