MapReduce 编程模型概述

MapReduce 编程模型给出了其分布式编程方法,共分 5 个步骤: 1) 迭代(iteration)。遍历输入数据, 并将之解析成 key/value 对。 2) 将输入 key/value 对映射(map) 成另外一些 key/value 对。 3) 依据 key 对中间数据进行分组(grouping)。 4) 以组为单位对数据进行归约(reduce)。 5) 迭代。 将最终产生的 key/
相关文章
相关标签/搜索