索引压缩学习总结

词典压缩 词典中通常包含三部分信息,原词,df,及倒排索引指针.其中要压缩的是原词,存在不规则性 若是都去开辟最大那个原词的字节空间,那么整个字典树将有很是大的空间浪费. 将单词单独抽取出来放在一个单独的存储区内,原词的位置存放指向该词语的指针. 再次优化能够将指针在某个范围内仅仅保存一个指针,在单词存储区保存原词及词长. 倒排列表压缩算法 评价索引压缩算法的指标:压缩率,压缩速度,解压速度,先对
相关文章
相关标签/搜索