信息检索——索引压缩

索引压缩 目录 索引压缩 为什么需要压缩? 两种压缩方式: 信息检索中词项的统计特性 Heaps定律 Zipf定律 词典压缩 用定长数组来存储词典中的词项。 将词典看成单一字符串的压缩方法   按块存储 前端编码 倒排记录表的压缩 可变字节编码VB编码 gamma 编码   索引压缩:对词典和倒排记录表这两个数据结构进行压缩。   为什么需要压缩? 使用更少的磁盘空间 节省资金 在内存中存放更多信
相关文章
相关标签/搜索