使hadoop支持Splittable压缩lzo

luoli哥要删本身的blog了,因此好文章赶忙转过来,指望之后还有的看:)node 在hadoop中使用lzo的压缩算法能够减少数 据 的大小和数据的磁盘读写时间,不只如此,lzo是基于block分块的,这样他就容许数据被分解成chunk,并行 的被hadoop处理。这样的特色,就可让lzo在hadoop上成为一种很是好用的压缩格式。     因为压缩的数据一般只有原始数据的1/4,在HDFS中
相关文章
相关标签/搜索