文本挖掘学习(六) 文档分类

1.朴素贝叶斯 朴素贝叶斯 = 贝叶斯公式 + 条件独立假设 抛弃词条间的关联,假设各个词条完全独立,完全基于词袋模型进行计算 2.sklearn实现 # 文档分类 # 朴素贝叶斯 # 从原始语料df中提取出所需的前两章段落 raw12 = df[df.chap.isin([1,2])] raw12ana = raw12.iloc[list(raw12.txt.apply(len) > 50),
相关文章
相关标签/搜索