python+jieba+tfidf算法 文本相似度

python+jieba+tfidf算法 文本相似度 2018年05月16日 20:57:28 HeCCXX 阅读数:9642 jieba是python第三方库,用于自然语言处理,对文本进行分词,当然也有其他的分词库。 gensim库,利用TFIDF算法来进行文本相似度计算,通过利用gensim库的corpora,models,similarities处理后续。 基本思路:jieba进行分词,整理
相关文章
相关标签/搜索