朴素贝叶斯进行非结构化文本分类

朴素贝叶斯非结构化文本分类 英语单词大概有1百万左右,若是分别计算每一个词在当前位置出现的几率来计算整篇文章的几率的话,是不现实的 所以咱们采起另外一种简化方法,即转化积极文档的第n个位置是单词x的几率为单词x在积极文档中出现的几率。 通常步骤以下 1.肯定词汇表的大小,即积极文档和消极文档中出现的全部独立单词的个数。 对于每一个单词计算积极消极两种假设的几率     1.1 将积极文档合并成一个
相关文章
相关标签/搜索