hive四种存储格式介绍与分析比较

一、四种存储格式介绍 1、TestFile  TextFile文件不支持块压缩,默认格式,数据不做压缩,磁盘开销大,数据解析开销大。这边不做深入介绍。 2、RCFile  Record Columnar的缩写。是Hadoop中第一个列文件格式。能够很好的压缩和快速的查询性能,但是不支持模式演进。通常 写操作比较慢,比非列形式的文件格式需要更多的内存空间和计算量。  RCFile是一种行列存储相结合
相关文章
相关标签/搜索