【机器学习PAI实践七】文本分析算法实现新闻自动分类

1、背景 新闻分类是文本挖掘领域较为常见的场景。目前不少媒体或是内容生产商对于新闻这种文本的分类经常采用人肉打标的方式,消耗了大量的人力资源。本文尝试经过智能的文本挖掘算法对于新闻文本进行分类。无需任何人肉打标,彻底由机器智能化实现。web 本文经过PLDA算法挖掘文章的主题,经过主题权重的聚类,实现新闻自动分类。包括了分词、词型转换、停用词过滤、主题挖掘、聚类等流程。算法 2、数据集介绍 具体字
相关文章
相关标签/搜索