Hadoop压缩

Hadoop压缩 1、2种Hadoop自带压缩格式的特征比较 2、gzip压缩   优点:压缩率比较高,而且压缩/解压速度也比较快;hadoop本身支持,在应用中处理gzip格式的文件就和直接处理文本一样;有hadoop native库;大部分linux系统都自带gzip命令,使用方便。缺点:不支持split。 3、bzip2压缩  优点:支持split;具有很高的压缩率,比gzip压缩率都高;h
相关文章
相关标签/搜索