Python3——文章标题关键字提取

思路:1.读取全部文章标题;2.用“结巴分词”的工具包进行文章标题的词语分割;3.用“sklearn”的工具包计算Tf-idf(词频-逆文档率);4.获得知足关键词权重阈值的词html 结巴分词详见:结巴分词Githubpython sklearn详见:文本特征提取——4.2.3.4 Tf-idf项加权git import os import jieba import sys from sklea
相关文章
相关标签/搜索