Hadoop入门——MapReduce

  (1)简介 MapReduce是一种分布式计算模型,由Google提出,主要用于搜索领域,解决海量数据的计算问题. MR由两个阶段组成:Map和Reduce,用户只需要实现map()和reduce()两个函数,即可实现分布式计算,非常简单。 这两个函数的形参是key、value对,表示函数的输入信息。 (2)原理   (3)执行步骤 1. map任务处理 1.1 读取输入文件内容,解析成key
相关文章
相关标签/搜索