一文了解倒排表

时间 2021-01-04

原文原文链接

1.前言我们先回顾最简单的问答系统：就是给定一个问题，去语料库中匹配相似度最高的问题所对应的答案语料库每个样本是：< 问题，答案 > 缺点：假如我们语料库有 N 个 < 问题，答案> 对，那么，对于每个用户提出的问题，我们需要计算 N 次相似度，才能返回最高相似度的。所以他的复杂度为：O(N)* (每次相似度计算的复杂度) 解决的核心思路：层次过滤方法复杂度：过滤器1 < 过滤器2 <