shuffle的工做原理

shuffle实现的功能web 分区 决定当前key交给那个reducer进行处理 相同的key必须在一个reduce task中 默认:按照key的hashCode值对reduce的个数进行取余 若是是自定义分区,默认是对key进行分区,可是咱们也能够根据value进行分区多线程 分组 将相同的key的value进行合并,key相同的话,会分到同一组 在mapReduce阶段 一行调用一次map
相关文章
相关标签/搜索