Hadoop离线项目处理技术

介绍一个 Hadoop生态离线项目:web 涉及到的技术:面试            Hadoop:HDFS(数据存储的地方)     MapReduce(用来作数据清洗)     YARN                            Hadoop集群shell            Hive:数据清洗以后,数据放在hdfs上,须要使用外部表,全部维度的数据统计分析须要经过SQL进行处理
相关文章
相关标签/搜索