MapReduce基本流程与设计思想初步

这一批博文是博主由博客园搬移过来的,所以时间上可能存在混乱,希望大家见谅! 1.MapReduce是什么?   MapReduce是一种编程模型,用于大规模数据集的并行运算。它借用了函数式的编程概念,是Google发明的一种数据处理模型。   主要思想为:Map(映射)和Reduce(化简)。    一个Map/Reduce作业(Job)通常会把输入的数据集切分为若干独立的数据块,由Map任务(T
相关文章
相关标签/搜索