信息论之进制压缩算法(在hbase索引压缩中的应用)

前言 大家都知道hbase的使用中,最重要的是rowkey的设计。而rowkey的设计中有三个关键点: 1、前缀预防读写热点 2、前缀适合查询场景 3、在满足1、2的前提下,关注索引的存储空间 关于1和2,介绍的文章很多。这篇文章主要分析一下索引的空间利用率,并试图推导出一套具有广泛应用价值的存储压缩思想。 信息的量化 我们先用世界杯的例子介绍一下信息论一个重要的概念 信息量。 2018年的世界杯
相关文章
相关标签/搜索