Hadoop MapReduce原理及实例

MapReduce是用于数据处理的一种编程模型,简单但足够强大,专门为并行处理大数据而设计。java 1. 通俗理解MapReduce MapReduce的处理过程分为两个步骤:map和reduce。每一个阶段的输入输出都是key-value的形式,key和value的类型能够自行指定。map阶段对切分好的数据进行并行处理,处理结果传输给reduce,由reduce函数完成最后的汇总。python
相关文章
相关标签/搜索