Mapreduce分布式编程

一、本质 MapReduce是一个基于分治思想,用于处理海量数据的分布式计算框架。  Mapreduce框架的主要程序分为三种即Master,Map和Reduce 二、mapreduce解决了什么问题 1.数据分布式存储-HDFS 2.作业调度 3.容错 4.机器间通信等复杂问题 三、分布式计算vs单机计算 四、MapReduce执行流程 1.四个阶段 Input到map: ①file:HDFS中
相关文章
相关标签/搜索