Hadoop中MR支持的各种压缩及解码器

Hadoop中MR支持的各种压缩及解码器  MR中默认支持DEFLATE压缩格式,文件扩展名.defiate 和文本处理相同,不需要修改。  Gzip压缩:压缩率比较高,并且压缩/解压速度也比较快,且被hadoop本身支持,大部分Linux系统自带Gzip命令,使用方便,但是不支持切片。当每个文件压缩之后在130M以内,都可以考虑用Gzip压缩,如一天或一个小时的日志。  Bzip2压缩:支持切片
相关文章
相关标签/搜索