Hive(六) Hive 分桶

1 hive 分桶概述 分桶表是对列值取哈希值的方式,将不同数据放到不同文件中存储。 对于 hive 中每一个表、分区都可以进一步进行分桶。 由列的哈希值除以桶的个数来决定每条数据划分在哪个桶中。 适用场景: 对比 MR 的 HashPartition 数据抽样( sampling ) 2 开启支持分桶 set hive.enforce.bucketing=true; 默认:false;设置为 t
相关文章
相关标签/搜索