hive分桶管理

分桶:按照用户创建表时指定的分桶字段进行hash散列多个文件 1.hive分桶的原理 跟MR中的HashPartitioner的原理一模一样            MR中:按照key的hash值去模除以reductTask的个数          Hive中:按照分桶字段的hash值去模除以分桶的个数 2.hive分桶的作用 好处: 1、方便抽样 2、提高join查询效率 3.hive分桶和分区的
相关文章
相关标签/搜索