Hive表的数据压缩、存储及Hive的序列化

一、数据的压缩 1、数据的压缩说明 (1)压缩模式评价 可使用以下三种标准对压缩方式进行评价 1、压缩比:压缩比越高,压缩后文件越小,所以压缩比越高越好; 2、压缩时间:越快越好; 3、已经压缩的格式文件是否可以再分割:可以分割的格式允许单一文件由多个Mapper程序处理,可以更好的并行化; (2)常见压缩格式 压缩方式 压缩比 压缩速度 解压缩速度 是否可分割 gzip 13.4% 21 MB/
相关文章
相关标签/搜索