MapReduce三种分区方法

何时分区 当map函数输出数据到循环内存缓冲区,数据达到循环内存缓冲区的阀值时,会将数据溢写到文件中,在写入文件之前会对数据进行分区 分区分类及如何实现 第一种:默认分区             系统自动调用HashPartitioner类进行分区,原码如下: 该类通过继承Partitioner类实现分区,将key的哈希值与integer的最大值做&运算,并%1来设置分区 第二种:自定义分区   
相关文章
相关标签/搜索