自然语言处理(三)主题模型

为了解决“一词多义”和“多词一意”的问题,引入“主题” LDA本质是一个三层贝叶斯网络 1、共轭分布 1、Beta分布是二项分布的共轭先验分布 2、Dirichlet分布是多项分布的共轭先验分布 Dirichlet分布的参数 [α1,α2,....,αn] ,一般 α 都取一样的值。 α=1 均匀分布 α>1 主题分布相等的概率增大 α<1 某一主题突出的概率增大 2、LDA模型 LDA模型框图如
相关文章
相关标签/搜索