MapReduce的初步理解

MapReduce 是什么? MapReduce 是一个 软件框架,可以采用并行、分布式处理GB、TB,甚至PB级的大数据集,同时它也是一个在商用服务器集群之上完成大规模数据处理的执行框架。 MapReduce 是一种 编程范式,可以利用集群环境的成百上千台服务器实现强大的可伸缩性。 上图给出了MapReduce执行过程的视图。简单来说,MapReduce的目标就是实现可伸缩性。使用MapRedu
相关文章
相关标签/搜索