Hive之分桶表解析

分区针对的是数据的存储路径;分桶针对的是数据文件。  分区提供一个隔离数据和优化查询的便利方式。不过,并非所有的数据集都可形成合理的分区。  分桶是将数据集分解成更容易管理的若干部分的另一个技术。  1、创建分桶表  create table stu_buck( id int,  name string )  clustered by(id) into 4 buckets  row format
相关文章
相关标签/搜索