jieba-基于TextRank关键词提取的实现

jieba-基于TextRank关键词提取的实现 对每个句子进行分词和词性标注处理 过滤掉除指定词性外的其他单词,过滤掉出现在停用词表的单词,过滤掉长度小于2的单词 将剩下的单词中循环选择一个单词,将其与其后面4个单词分别组合成4条边。 例如:[‘有’,‘媒体’, ‘曝光’,‘高圆圆’, ‘和’, ‘赵又廷’,‘现身’, ‘台北’, ‘桃园’,‘机场’,‘的’, ‘照片’]对于‘媒体‘这个单词,就
相关文章
相关标签/搜索