LDA主题模型

LDA主题模型 LDA是一种基于概率模型的主题模型算法(generative probabilistic model),用来识别大规模文档集或者语料库中隐含的主题信息。对于语料库中的每篇文档,LDA定义了如下生成过程: 对每一篇文档,从主题分布中抽一个主题 从上述被抽到的主题对应的单词分布中抽一个单词 重复上述过程直至遍历文档中的每个词 LDA认为每篇文档是多个主题混合而成,而每个主题可以由多个词
相关文章
相关标签/搜索