Hadoop 数据压缩

1 概述 压缩技术能够有效减少底层存储系统(HDFS) 读写字节数。压缩提高了网络带宽和磁盘空间的效率。在 Hadoop 下,尤其是数据规模很大和工作负载密集的情况下,使用数据压缩显得非常重要。在这种情况下, I/O 操作和网络数据传输要花大量的时间。还有, Shuffle与 Merge 过程同样也面临着巨大的 I/O 压力。 鉴于磁盘 I/O 和网络带宽是 Hadoop 的宝贵资源,数据压缩对于
相关文章
相关标签/搜索