6.Hadoop_MapReduce计算框架介绍、架构原理、yarn资源管理

MapReduce介绍 MapReduce分为2部分:MapTask、ReduceTask MapTask会把数据映射成一个k,v格式的中间数据集。每组相同key组成的数据(一般情况下)会并发调用reduce方法,方法内迭代这组数据进行计算(类似sql) MapTask数量:对Block Spilt(切片),每一个Spilt(片)会分配一个MapTask ReduceTask数量:一般情况下 相同
相关文章
相关标签/搜索