MapReduce架构简介

前言: MapReduce是用于数据处理的一种编程模型,简单但足够强大,专门为并行处理大数据而设计。 MapReduce的处理过程分为两个步骤:map和reduce。每个阶段的输入输出都是key-value的形式,key和value的类型可以自行指定。map阶段对切分好的数据进行并行处理,处理结果传输给reduce,由reduce函数完成最后的汇总。 到了2.0之后,MapReduce可以理解为是
相关文章
相关标签/搜索