hadoop之基于某电商离线处理项目架构和实现二(ETL数据清洗)

目录java 1.需求git 2.详细设计github 3.使用idea进行MR编程shell 4.本机测试apache 5.服务器测试编程 6.使用hive完成最基本的统计分析vim 1.需求   对CDN的点击日志数据清洗bash 2.详细设计   进行MR编程,对日志文件数据进行清洗,并将清洗后的数据加载到hive外部表服务器 3.使用idea进行MR编程     这里不进行详细的记录。项目
相关文章
相关标签/搜索