【朴素贝叶斯】实战朴素贝叶斯_基本原理

【写在前面】算法 最近由于工做缘由,须要作文本过滤任务,即从海量文本中过滤掉杂质文本——也能够理解为感兴趣的文本。这是一个特殊的文本分类任务。特殊在于,只有两个类别;并且杂质文本的数量远小于正常文本的数量。数据结构 先不理会它的特殊性。咱们就按照文本分类任务来作。首先想到的,天然是号称最简单、最高效的naive bayes模型。不过实践起来,发现遇到的问题挺多。模型不复杂,但在应用的时候,还须要考
相关文章
相关标签/搜索