朴素贝叶斯模型结合 Tf-idf 算法进行文本分类

1、朴素贝叶斯的原理 基于朴素贝叶斯公式,比较出后验几率的最大值来进行分类,后验几率的计算是由先验几率与类条件几率的乘积得出,先验几率和类条件几率要经过训练数据集得出,即为朴素贝叶斯分类模型,将其保存为中间结果,测试文档进行分类时调用这个中间结果得出后验几率。算法 2、朴素贝叶斯应用场景 须要一个比较容易解释,并且不一样维度之间相关性较小的模型的时候。 能够高效处理高维数据,虽然结果可能不尽如人意
相关文章
相关标签/搜索