改进向量空间模型

声明:只是对向量空间模型的介绍(或者叫推广),并没有理论创新工作。 本人在之前的《向量空间模型(VSM)在文档相似度计算上的简单介绍》和《向量空间模型文档相似度计算实现(C#)》两篇文章中分别介绍了简单SVM模型及其实现。 本人使用简单词频(即词在当前文档中出现的次数)信息,实现了一个朴素版本的向量空间模型,效果尚可,但还是有很多可改进之处。 直接使用词的个数在比较词数很多和词数很少的文档时存在着
相关文章
相关标签/搜索