tf-idf关键词提取算法

tf-idf简介 在信息提取的应用场景之中,咱们每每须要一些文本中的重要的词而不是文本中的全部词语来进行分析,即便原文本已经进行了去停用词的处理。 那么什么样的词算是文本中的关键词呢?一方面,这个词应该在文本中出现的次数比较多;另外一方面,这个词应该不那么常见,如果这个词在不少文档中都有出现,这个词显然不能用来做为表明某个文档的重要词汇。一个合适的算法即是tf-idf算法。 tf-idf是term
相关文章
相关标签/搜索