11.主题模型概述(PLSA+LDA)

1.引出主题模型 对于文本分类的问题出现了“一词多义”,“多词一义”,朴素贝叶斯无法解决! 针对此,引出主题这个概念,通过主题,可以把一个词映射到多个主题中,可以把多个词映射到一个主题中去! ps:通过主题这个隐变量,来改善现存的问题! 2.主题模型之pLSA(EM算法的应用) 1.选定文档  2.通过文档选定主题   3.通过主题选定词 ps:主要流程就是通过文档选择一个主题,根据主题来进行词的
相关文章
相关标签/搜索