LDA主题模型

LDA(Latent Dirichlet Allocation)是一种文档主题生成模型,这个模型包含了词、主题和文档三层结构。所谓的生成模型,就是说我们人为一篇文章的每个词都是通过 “以一定概率选择了某个主题,并从这个主题中以一定的概率选择某个词语” 的这样的一个过程得到的。其中,词、主题和文档的关系就是文档到主题服从多项式分布,主题到词也服从多项式分布。 首先,我们直观地看一下 LDA 模型,比
相关文章
相关标签/搜索