Hive分桶表学习总结

前言 学习总结一下Hive的分桶表。 分桶规则:对分桶字段值进行哈希,哈希值除以桶的个数求余,余数决定了该条记录在哪个桶中,也就是余数相同的在一个桶中。 优点:1、提高join查询效率 2、提高抽样效率 1、建表 通过 clustered by(字段名) into bucket_num buckets 分桶,意思是根据字段名分成bucket_num个桶 create table test_buck
相关文章
相关标签/搜索