Inverted Index(倒排索引)

传统的正排索引指的是doc->word的映射,然而在实际工做中,仅仅只有正排索引是远远不够的,好比我想知道某个word出如今那些doc当中,就须要遍历全部的doc,这在实时性要求比较严的系统中是不能接受的。所以,就出现了倒排索引(inverted index ),详细内容参见Wikipedia-Inverted index。本文主要讲解的是如何使用Scala编写Spark程序来实现倒排索引。htm
相关文章
相关标签/搜索