机器学习主题模型之LSA、pLSA、NMF

  1、主题模型(Topic Model)算法         判断文档类似性的传统方法是经过查看两个文档共同出现的词项(terms,不重复的words)有多少,如TF-IDF等。但这种方法没有考虑到文字背后的语义关联,可能在两个文档共同出现的词项不多甚至没有,但两个文档是类似的。dom         主题模型是用来在大量文档中发现潜在主题的一种统计模型。若是一篇文章有一个中心思想,那么一些特定
相关文章
相关标签/搜索