MapReduce程序运行流程分析

mapreduce运算过程分为两个过程:map阶段和reduce阶段 1.在进行数据计算时,首先通过DistributeInputStream对象进行获取数据 2.然后对数据块进行通过一定的偏移量进行切片,切片大小为默认128mb,然后每个切片对应着一个map集合,对于对单词的计数来说,map集合中的key是每个偏移量的数据,而value是默认是1 3.然后对map进行快速排序,其他工作的节点上的
相关文章
相关标签/搜索