自动提取关键词---TF-IDF原理

TF-IDF原理 写在前面: 假如有一篇很长的文章,要用计算机提取它的关键词(Automatic Keyphrase extraction),完全不加以人工干预,怎样才能正确做到? 有一个非常简单的算法,TF-IDF就可以很快速的解决这个问题。 一、例子讲解 假定现在有一篇长文《中国的蜜蜂养殖》,需要用计算机提取它的关键词。 一个容易想到的思路,就是找到出现次数最多的词。如果某个词很重要,它应该在
相关文章
相关标签/搜索