信息检索——向量空间模型(Vector Space Model)

TF:html tf 即 term frequency, 表示一个 term t 出如今 document d 中的次数,这是文档中一个很重要的概念。出现次数更多意味着重要程度越高,可是须要注意的是,相关度的提升并非和次数的提升成同比的。所以一般tf须要作以下的处理ide w1= log10(tf+1)spa 这样作就是要弱化次数对于相关度的影响htm DF/IDF:ci df 即 documen
相关文章
相关标签/搜索