Continuous Semantic Topic Embedding Model Using Variational Autoencoder论文阅读

该文提出了一种连续语义主题嵌入模型(CSTEM),该模型利用主题与词之间的连续语义距离函数来寻找文档中潜在的主题变量。语义距离可以用欧氏空间上任何对称的钟形几何距离函数来表示,本文采用马氏距离来表示。为了使语义距离更恰当地执行,我们新为每个单词引入了一个额外的模型参数,从这个距离中去掉全局因子,表明不管主题如何,它发生的可能性有多大。这无疑改善了以往的连续词嵌入主题模型中使用的高斯分布无法正确解释
相关文章
相关标签/搜索