Hadoop中的分区Partitioner???

参考 https://www.cnblogs.com/edisonchou/p/4297828.html Hadoop中分区,如果不指定的话,他会使用自带的HashPartitioner 如果你业务中有需求,需要使用分区来查看文件的时候,就需要自己定义分区来使用 例如上图,需要统计手机号码的信息,就需要剔除电话号码时??? 那你就需要自定义两个分区? 这时候,结果就会分为两个文件。 也许这就是 分
相关文章
相关标签/搜索