深入Hadoop之MapReduce

时间 2021-01-05

原文原文链接

MapReduce工作流程 WordCount 处理过程 1、将文件拆分成splits，并将文件按行分割成”key,value”对。 2、将分割好的”key,value”对交给用户定义的map方法进行处理，生成新的”key,value”对。 3、将map方法输出的”key,value”对后，Mapper会将它们按照key值进行排序。 4、Reduce先对Mapper接收的数据进行排序，在交给用户自