关键词提取(tf-idf与textRank)

关键词提取(tf-idf与textRank) 一.tf-idf tf-idf提取关键词是一种简单有效的提取关键词的方法.其思想主要在于预先统计在语料中出现的所有词的词频,计算出idf值,然后再针对要提取关键词的文章或句子的每个词计算出tf值,乘起来便是tf-idf值.值越大表示作为关键词的优先级越高. 假设现在语料一共有M篇文章,其中词A在其中m篇中出现过了,那么A的idf值为 log(M/m)
相关文章
相关标签/搜索