信息检索之文档评分、词项权重计算及向量空间模型

一、主要内容:     在文档规模很大的状况下,知足布尔查询的结果文档数量可能很是多,每每会大大超过用户可以浏览的文档的数目。须要对搜索出来的文档进行评分和排序。     ①、参数化索引及域索引的概念;目的:一、能够经过元数据(文档的做者、标题、出版日期等)来对文档进行索引和检索;二、上述索引可以提供一个简单的文档评分;     ②、词项字在文档中的权重的概念,并经过期出现的统计信息进行权重计算;
相关文章
相关标签/搜索