BM25理解

BM25算法是一种用于评价搜索词与文档之间相关性的算法,他是一种基于概率检索模型提出的算法。基本思想:我们现在有一个query和一批文档docs,现在要计算query和每一篇文档的doc之间的相关性分数,我们的做法就是,先对query进行切分,得到单词分数,其中单词分数由三部分组成: l 单词和query之间的相关性 l 单词和doc之间的相关性 l 单词本身的权重 最后对于每一个单词的分数做一个
相关文章
相关标签/搜索