Python文本数据分析:新闻分类任务(贝叶斯,TF-IDF词向量)

文章目录 基本思路 1.文本分析 11.查看数据 1.2转换为llist格式 1.3使用jieba分词 1.4转换为DataFrame格式 1.5使用停用词 1.6查看词频 1.7生成词云 2.TF-IDF关键词提取 2.1 提取关键词 3.LDA建模 3.1建模 3.2 输出20个主题的的关键词和权重 4.基于贝叶斯算法进行新闻分类 4.1 转换数据 4.2 建立训练、测试集 4.3 构建贝叶斯
相关文章
相关标签/搜索