3-hadoop之数据仓库hive(三) Hive 基础应用

一、Hive基础概念 1.hive数据模型 每个库的下面呢有一些表,横向分区,纵向分桶 分区:每个分区都为一个物理文件夹,对于一个不在表中存在的字段进行分 区,即分区的字段为虚字段,在这种水平的分层后数据是完全物理 隔离的之间没有关系 分桶:各分桶相互独立,最终形成一个完整的数据块,分桶采用的是实字段 每个分桶即为一个文件,按字段的哈希值分桶 二、HiveSql 按数据操作分类,来分别说明脚本的使
相关文章
相关标签/搜索