大数据学习笔记(MapReduce简介)

什么是MapReduce Hadoop MapReduce是一个易于编写应用程序的软件框架,该应用程序以一种可靠的、容错的方式,在大型硬件集群(数千个节点)上并行处理大量数据(多TB数据集)。 MapReduce的设计理念 MR主要思想就是: 分久必合 MR的核心思想: “相同”的key为一组,调用yicireduce方法,方法内迭代这一组数据进行计算 MR由两个阶段组成: map端 reduce
相关文章
相关标签/搜索