MapReduce原理简介

一、MapReduce是什么 MapReduce是一种分布式计算框架 ,以一种可靠的,具有容错能力的方式并行地处理上TB级别的海量数据集。主要用于搜索领域,解决海量数据的计算问题。 MR有两个阶段组成:Map和Reduce,用户只需实现map()和reduce()两个函数,即可实现分布式计算。 二、MapReduce做什么 MapReduce框架由Map和Reduce组成。 Map()负责把一个大
相关文章
相关标签/搜索