MapReduce原理

MapReduce是一种处理大型及超大型数据集并生成相关执行的编程模型。通俗来讲,MapReduce是一个大数据分布式计算框架,它基于google的一篇研究论文MapReduce。 MapReduce是由两个阶段组成: Map端 Reduce端 而Map端和Reduce端之间有着一系列复杂的suffle(洗牌)过程 主要思想:分久必合 核心思想:"相同"的key为一组,调用一次reduce方法,方
相关文章
相关标签/搜索