搜索引擎索引

倒排索引帮助搜索引擎在海量网页中快速找到包含用户查询词的所有网页。 基本概念 1.单词文档矩阵 如上图示,是表达哪些文档包含哪些单词的概念模型。 打对勾的位置代表包含关系;从纵向即文档维度看:每列代表文档包含了哪些单词,比如文档1包含了词汇1和4;从横向即单词维度看:每行代表单词在哪些文档中出现过,比如词汇2在文档2和3出现过。 而搜索引擎的索引就是实现单词文档矩阵的具体数据结构。可以有不同的方式
相关文章
相关标签/搜索