如何肯定LDA的topic个数

之前一直是按经验设置topic个数,数据量小就少点,数据量大就多点,大概50-500吧。最近有同窗跟我讨论,才想起来该找找相关文献,学习一下如何科学的肯定topic个数。机器学习 1.用perplexity-topic number曲线学习 LDA有一个本身的评价标准叫Perplexity(困惑度),能够理解为,对于一篇文档d,咱们的模型对文档d属于哪一个topic有多不肯定,这个不肯定程度就是P
相关文章
相关标签/搜索