机器学习--概率图算法--主题模型算法理论

一 主题模型基础认知 1 主题模型的概念 第一点:主题模型是生成式模型 一篇文章的每一个词:文档以一定概率选择某个主题,并从这个主题中以一定概率选择某个词 第二点:主题模型的目的 主题模型可以自动分析每个文档,统计文档内词语,根据统计的信息判断当前文档包含哪些主题以及这些主题所占比例大小 2 主题模型的优点 第一点:克服了传统信息检索中文档相似度计算的缺点(如词袋法等忽略语义与语序问题) 第二点:
相关文章
相关标签/搜索