MapReduce的原理及执行过程

MapReduce简介 1.MapReduce是一种分布式计算模型,是Google提出的,主要用于搜索领域,解决海量数据的计算问题。 2.MR由两个阶段组成:Map和Reduce,用户只需实现map()和reduce()两个函数,便可实现分布式计算。 MapReduce执行流程 MapReduce原理 MapReduce的执行步骤: 1.Map任务处理 1.1读取HDFS中的文件。每一行解析成一个
相关文章
相关标签/搜索