MapReduce--倒排索引

文档倒排算法简介 Inverted Index(倒排索引)是目前几乎全部支持全文检索的搜索引擎都要依赖的一个数据结构。基于索引结构,给出一个词(term),能取得含有这个term的文档列表(the list of documents) Web Search中的问题主要分为三部分:web crawling(gathering web content) ,网页爬虫,收集数据 indexing(cons
相关文章
相关标签/搜索