大数据之Hadoop(MapReduce(三))

四 Hadoop数据压缩 概述 压缩技术能够有效减少底层存储系统(HDFS)读写字节数。压缩提高了网络带宽和磁盘空间的效率。在Hadood下,尤其是数据规模很大和工作负载密集的情况下,使用数据压缩显得非常重要。在这种情况下,I/O操作和网络数据传输要花大量的时间。还有,Shuffle与Merge过程同样也面临着巨大的I/O压力。        鉴于磁盘I/O和网络带宽是Hadoop的宝贵资源,数据
相关文章
相关标签/搜索