Hive的分桶表

1 分桶表原理 分桶是相对分区进行更细粒度的划分;Hive表或分区表可进一步的分桶; 分桶将整个数据内容按照某列取hash值,对桶的个数取模的方式决定该条记录存放在哪个桶当中;具有相同hash值的数据进入到同一个文件中; 比如按照name属性分为3个桶,就是对name属性值的hash值对3取摸,按照取模结果对数据分桶。 取模结果为==0==的数据记录存放到一个文件 取模结果为==1==的数据记录存
相关文章
相关标签/搜索