MapReduce 统计手机用户的上行流量,下行流量,总流量,并对输出的结果进行倒序排序。(二),划分省份,输出到不同的文件

在(一)的基础上,写一个自己的partitioner就好了。   分区的默认实现HashPartitioner,它根据key的hashcode和Interger.  在Reduce过程中,可以根据实际需求(比如按某个维度进行归档,类似于数据库的分组),把Map完的数据Reduce到不同的文件中。分区的设置需要与ReduceTaskNum配合使用。比如想要得到5个分区的数据结果。那么就得设置5个Re
相关文章
相关标签/搜索