机器学习实战(三)——NaiveBayes朴素贝叶斯算法邮件分类

朴素贝叶斯分类的原理是条件几率的计算: 在已知先验几率的条件下,计算后验几率,后验几率便是在当前数据条件下属于分类1或者分类2 的几率,取几率较大的一个为输出。 贝叶斯准则很熟悉了,不解释了,但在这个算法中引入了一个很重要的思想:将文本等数据对象转化为向量格式进行计算。 其中包含了:一、正则表达式的运用,python中re库的运用 二、留存交叉验证:将样本一部分用做训练,一部分用做测试,当将训练组
相关文章
相关标签/搜索