《信息检索导论》第五章总结

一、索引压缩概述 使用压缩的目的: (1)因为我们想要把尽量多的数据放入内存,因此压缩能够达到这个目的; (2)从磁盘到内存的传输时间会缩短; 压缩分类: (1)无损压缩:压缩后的数据能还原全部信息; (2)有损压缩:压缩后会丢失一些信息; 如果有损压缩后丢失的信息用户并不关心,则有损压缩也是可以接受的; 二、Heaps定律 通过整个文档集词条数来估计词项数目; 主要思想:随着文档集增加,词项数目
相关文章
相关标签/搜索