Text mining and analytics第三周学习笔记

时间 2020-12-23

标签文本挖掘与分析斯坦福文本挖掘与分析 PLSA LDA 混合模型栏目 HTML 繁體版

原文原文链接

指导性问题：（1）什么是混合模型？一般来说，如何计算从混合模型中观察特定单词的概率？这个概率表达式的一般形式是什么？（2）混合模型的分量词分布的最大似然估计是什么样的？他们在什么意义上“协作”和/或“竞争”？为什么我们可以使用固定的背景词分布来强制发现的主题词分布，以减少它在常见的（通常是非内容的）词上的概率？（3）EM算法的基本思想是什么？ E步骤通常会做什么？ M-step通常会做什么？

>>阅读原文<<