hadoop笔记1-MR执行过程

MR执行过程包括Map、Shuffler、Reduce,其中Map、Reduce及Shuffler中的分区、合并、排序是能够容许程序员编程参与的。程序员 一、Map阶段。算法 split-----map----partition sort and spill to disk------combine。编程 1)split的目的是应一个原始文件分红多个文件,分别交由不一样的map节点处理,文件块大小
相关文章
相关标签/搜索