hive 数据压缩与存储格式选择

概述 为什么会出现需要对文件进行压缩?  在Hadoop中,文件需要存储、传输、读取磁盘、写入磁盘等等操作,而文件的大小,直接决定了这些这些操作的速度。 常见压缩方式、压缩比、压缩解压缩时间、是否可切分 原文件:1403M Snappy 压缩:701M,压缩时间:6.4s,解压时间:19.8s,不可切分 LZ4 压缩:693M,压缩时间:6.4s,解压时间:2.36s,不可切分 LZO 压缩:68
相关文章
相关标签/搜索