hive分区的概念以及操作方法

hadoop生态组件之hive hive处理的数据是存储在HDFS中 hive分析数据底层的默认实现是mapReduce 执行程序运行在Yarn上 在开启hive之前一定要先开启hdfs和yarn hive的分区概念: hive分区按照设置的分区字段,将一个大的数据集根据业务需要分割成小的数据集,在查询时通过WHERE子句中的表达式选择查询所需要指定的分区,这样的查询效率会提高很多。 分区的操作流
相关文章
相关标签/搜索