LDA模型困惑度计算出现的问题

LDA程序使用的是JGibbLDA 读theta文件,构造theta二维矩阵。 读phi文件,构造phi二维矩阵。 读tassign文件,获得每篇文本的词数Nd,继而获得测试集的总词数Nsum;并根据tassign文件构造每篇文本全部词组成的词表。 编程实现,根据tassign文件构造测试集每篇文本中全部词组成的词表,根据该词表(Map形式,存储的是每篇文本全部出现的词的词id(词不排重)),获得
相关文章
相关标签/搜索