MR案例之倒排索引TF-IDF

MR案例之倒排索引 简介: "倒排索引"是文档检索系统中最经常使用的数据结构,被普遍地应用于全文搜索引 它主要是用来存储某个单词(或词组)在一个文档或一组文档中的存储位置的映射, 即提供了一种根据内容来查找文档的方式。 因为不是根据文档来肯定文档所包含的内容, 而是进行相反的操做,于是称为倒排索引(Inverted Index)。 详情描述 一般状况下,倒排索引由一个单词(或词组)以及相关
相关文章
相关标签/搜索