Hadoop2.X知识点笔记

Hadoop是分布并行的任务处理的系统框架,拥有独特的存储方式,用于处理数据的工具通常在于数据相同的服务器上,通过分发数据可以是数据所在的节点并行的处理,非常高效。 MapReduce是离线计算框架,Spark是内存计算的实时计算框架,Storm是流式计算框架。 Federation的应用场景,超大数据中,把大数据分类成不同的模块,每个模块数据分为不同的namenode来存储。每个namenode
相关文章
相关标签/搜索