信息检索导论学习笔记(6)-文档评分,词项权重计算及向量空间模型

参数化索引及域索引 迄今为止,咱们都将文档当作一系列词项的序列.实际上,大多数文档都具备额外的结构信息.数字文档一般会把与之相关的元数据(metadata)以机读的方式一块儿编码.所谓元数据,指的是和文档相关的一些特定形式的数据,好比文档的做者,标题以及出版日期等等. 问题:考虑查询"寻找由William Shakespeare 于 1961年撰写,其中包含短语alas poor Yorick的文
相关文章
相关标签/搜索