数据处理流程

 流程图解析   典型的BI系统体流程如下:   由于是处理海量数据,流程中各环节所使用的技术则跟传统BI完全不同,后续课程都会一一讲解:   1) 数据采集:定制开发采集程序,或使用开源框架FLUME   2) 数据预处理:定制开发mapreduce程序运行于hadoop集群   3) 数据仓库技术:基于hadoop之上的Hive   4) 数据导出:基于hadoop的sqoop数据导入导出工具
相关文章
相关标签/搜索