(3) 使用sklearn包提取文章的关键词

本篇一样是使用TF-IDF算法提取关键词,只不过是使用sklearn中封装好的包进行提取。不一样的是对原始语料库格式的要求,sklearn要求语料库中文章的分词之间以空格分隔,如如下示例:算法 segment 第一篇文章 我 是 中国 人 。 第二篇文章 你 是 美国 人 。 第三篇文章 他 叫 什么 名字? 第四篇文章 她 是 谁 啊? TF-IDF的实验参考上一篇使用TF-IDF算法提
相关文章
相关标签/搜索