MapReduce的原理及执行过程

MapReduce简介 MapReduce是一种分布式计算模型,是Google提出的,主要用于搜索领域,解决海量数据的计算问题。 MR有两个阶段组成:Map和Reduce,用户只需实现map()和reduce()两个函数,即可实现分布式计算。 MapReduce执行流程    MapReduce原理      MapReduce的执行步骤: 1、Map任务处理   1.1 读取HDFS中的文件。每
相关文章
相关标签/搜索