主题模型(概率潜语义分析PLSA、隐含狄利克雷分布LDA)

  一、pLSA模型 1、朴素贝叶斯的分析 (1)可以胜任许多文本分类问题。 (2)无法解决语料中一词多义和多词一义的问题——它更像是词法分析,而非语义分析。 (3)如果使用词向量作为文档的特征,一词多义和多词一义会造成计算文档间相似度的不准确性。 (4)可以通过增加“主题”的方式,一定程度的解决上述 问题:一个词可能被映射到多个主题中(一词多义),多个词可能被映射到某个主题的概率很高(多词一义)
相关文章
相关标签/搜索