Text mining and analytics第三周学习笔记

指导性问题: (1)什么是混合模型?一般来说,如何计算从混合模型中观察特定单词的概率?这个概率表达式的一般形式是什么? (2)混合模型的分量词分布的最大似然估计是什么样的?他们在什么意义上“协作”和/或“竞争”?为什么我们可以使用固定的背景词分布来强制发现的主题词分布,以减少它在常见的(通常是非内容的)词上的概率? (3)EM算法的基本思想是什么? E步骤通常会做什么? M-step通常会做什么?
相关文章
相关标签/搜索