搜索引擎————倒排索引

1.倒排索引基本概念 文档(Document):通常搜索引擎的处理对象是互联网网页,而文档表明以文本形式存在的存储对象,比网页来讲更加普遍,好比Word,PDF,html,XML等不一样格式的文件均可以称之为文档。再好比一封邮件,一条短信,一条微博也能够称之为文档。 文档集合(Document Collection):由若干文档构成的集合称之为文档集合。 文档编号(Document ID):在搜索
相关文章
相关标签/搜索