主题模型的学习

对于主题模型而言,重新再理一遍思路,然后在梳理思路的同时,可以知道自己理解不到位的点,也许可以知道下一步的应用情况。 一般而言,我们对于文档集的表示是通过在词项空间来表示的,即利用词袋模型(bag-of-words)的形式来表示文档,此时的词项空间维数很大,通过主题模型之后,可以将文档的维数降低到K维,(K个主题),此时就可以大幅度的降维。 主题模型的起源是LSA(LSI),其并不是一个概率模型,
相关文章
相关标签/搜索