MapReduce体系架构详解

1. 什么是MapReduce? 简言之,mapreduce 一种可用于数据处理的以数据为中心(数据本地化)分布式编程模型,采用的是一种分而治之的思想,分为map和reduce两个阶段。 Map: 将一个Job分解为若干个task Recude: 完成分解的task,并且汇总结果。 eg: 图书馆以书架进行图书清点。这里“以书架为单位”,就是map的过程,分配任务。而每个书架安排人来清点并且汇总最
相关文章
相关标签/搜索