NLP中关键词的提取

一:关键词提取的方法有多种,分别如下: TF-IDF、主题模型、TestRank、rake 二:首先来说一下TF-IDF: TF是词频,IDF是逆向文件频率,IDF起到给词赋予权重的作用。 TF-IDF的思想:重要的词一定在文章中出现多次,但同时在各个文章中出现多次的词一定没有在只在同一篇文章中出现多次的词的重要性大。 此方法类似统计方法,下面把计算方法列举出来: TF=某个词在文章出现的次数/文
相关文章
相关标签/搜索