Lucene源码(二):文本类似度TF-IDF原理

Lucene中TF-IDF的计算公式与普通的TF-IDF不同。学习以后,感受Lucene的计算方法更加合理,考虑得更加周全。 q:query,即搜索内容,例如:githubgit d:document,即文档内容,例如:i like github程序员 即咱们的搜索内容"github"跟文档内容"i like github"的TF-IDF值(类似度)。TF-IDF值越高,搜索的内容与文档的匹配度越
相关文章
相关标签/搜索