MapReduce核心思想

定义:Mapreduce是一个分布式运算程序的编程框架,是用户开发“基于hadoop的数据分析应用”的核心框架。 特点:Mapreduce数据源是静态的,每个MapReduce作业的输出结果都会写入磁盘,会产生磁盘IO。 1、分布是的运算程序往往需要分成至少2个阶段 2、第一阶段的mapreduce并发运行,互不相干 3、mapreduce编程中只能包含一个map阶段,一个reduce 阶段。 4
相关文章
相关标签/搜索