WordCount运行原理结合代码详细分析

一、MapReduce理论简介   1.1 MapReduce编程模型   MapReduce采用"分而治之"的思想,把对大规模数据集的操做,分发给一个主节点管理下的各个分节点共同完成,而后经过整合各个节点的中间结果,获得最终结果。简单地说,MapReduce就是"任务的分解与结果的汇总"。html   在Hadoop中,用于执行MapReduce任务的机器角色有两个:一个是JobTracker;
相关文章
相关标签/搜索