reducetask的并行度

reducetask的并行度 //指定reducetask的个数 job.setNumReduceTasks(4); 参数决定的 默认值是1 当有多个reducetask的时候,每一个reducetask的数据如何分配的,由分区算法决定 1、默认的分区算法 mapkey.hash % numReduceTask的个数; 只需要设置reduecetask的个数,分区数===reducetask的个数
相关文章
相关标签/搜索