倒排索引学习

在搜索引擎中每一个文件都对应一个文件ID,文件内容被表示为一系列关键词的集合(实际上在搜索引擎索引库中,关键词也已经转换为关键词ID)。例如“文档1”通过分词,提取了20个关键词,每一个关键词都会记录它在文档中的出现次数和出现位置。数组 获得正向索引的结构以下:数据结构        “文档1”的ID > 单词1:出现次数,出现位置列表;单词2:出现次数,出现位置列表;…………。函数      
相关文章
相关标签/搜索