信息检索——倒排索引和布尔查询

  线性扫描 词项-文档关联 倒排索引 查询处理AND 布尔查询 自由文本查询 查询优化     举例:查找《莎士比亚》中的人名 1 AND 2 but NOT 3   线性扫描grepping: 从头到尾阅读该全集,对每部剧本都留心是否包含1和2不包含3 缺点: 太慢 不灵活 无法排序   词项-文档关联   缺点: 太大了 而且99.8%的元素都为0   更好的方法是只记录原始矩阵中1的位置
相关文章
相关标签/搜索