文档生成模型:多元贝努利vs多项式

在使用朴素贝叶斯(NB)对文档进行分类时,会使用到文档的生成模型,为何呢?仍是从贝叶斯公式出发,其中右半部分就是生成一篇文档的过程,首先选择一个类c,而后根据这个类以必定几率生成文档d。P(c)没什么说的了,知足categorical分布(一次的多项式分布)就能够了。而P(d|c)就比较有意思了,主要能够用两种分布来模拟,一种是多元贝努利分布,一种是多项式分布,这里介绍这两种模拟方法的思想和区别。
相关文章
相关标签/搜索