《Hadoop权威指南》笔记-关于MapReduce

本笔记主要总结记录2.4节 横向扩展。 本小结简单介绍了Hadoop中MapReduce的执行流程,即对数据流的处理过程,和多map对应多reduce的情况。 数据流 Mapduce主要分成一下五步: 1. MapReeduce作业(job) :客户端需要执行的一个工作单元,包括输入数据、MapReduce程序和配置信息。其主要分为两大类任务:map任务和reduce任务,这些任务运行在集群节点上
相关文章
相关标签/搜索