MapReduce2.0原理及基本架构

MapReduce2.0原理及基本架构 MapReduce是Hadoop核心框架之一,我们知道Hadoop是又分布式文件系统HDFS和分布式计算框架组成。MapReduce就是一种离线数据计算框架。那么作为计算机框架的套路,会有输入经过处理后输出结构,MapReduce就是将任务分为两个阶段:Map阶段和Reduce阶段。每个阶段都是用键值对(key/value)作为输入(input)和输出(ou
相关文章
相关标签/搜索