Hadoop学习(2)——组件介绍(MapReduce)

一、分布式计算框架MapReduce介绍(计算向数据移动) 1.1、为什么叫MapReduce MR原语:map + reduce(MapTask & ReduceTask)输入(格式化k,v)数据map映射成一个中间数据集(k,v)reduce (sql) “相同”的key为一组,调用一次reduce方法,方法内迭代这一组数据进行计算 (类似的sql) 1.2、计算框架MR(wordcount
相关文章
相关标签/搜索