面试常问:Hive分区与分桶的区别

分区表与分桶表的区别: 建立表时能够同时为表建立一个或者多个分区,咱们在加载数据时为期指定具体的 分区,查询数据时能够指定具体的分区从而提升效率。 分区表是把分区当成目录的,分区其实是将表文件分红多个有标记的小文件以方便查询。 分区表: 在Hive Select查询中,通常会扫描整个表内容(HDFS上文件的内容),会消耗不少时间作不必的工做。分区表指的是在建立表时,指定partition的分区空间
相关文章
相关标签/搜索