数据仓库(九)---hive的性能优化---hive索引机制和原理

咱们在上一章学习了hive的动态分区,本章来学习另一种优化的手段 索引。 数据仓库(八)—hive的性能优化—hive动态分区java hive索引介绍 Hive的索引目的是提升Hive表指定列的查询速度。 没有索引时,相似’WHERE tab1.col1 = 10’ 的查询,Hive会加载整张表或分区,而后处理全部的rows, 可是若是在字段col1上面存在索引时,那么只会加载和处理文件的一部分
相关文章
相关标签/搜索