Hive四种文件格式详解

Hive 支持的存储数的格式主要有: TEXTFILE SEQUENCEFILE ORC PARQUET 列式存储和行式存储: 上图左边为逻辑表,右边第一个为行式存储,第二个为列式存储。 行存储的特点: 查询满足条件的一整行数据的时候,列存储则需要去每个聚集的字段找到对应的每个列的值,行存储只需要找到其中一个值,其余的值都在相邻地方,所以此时行存储查询的速度更快。 列存储的特点: 因为每个字段的数
相关文章
相关标签/搜索