关键词提取算法学习笔记

简介中最为重要就是说了有监督算法和无监督算法的区别,为什么有监督算法不适合于关键词提取进行了特别说明。 TF-IDF学习笔记: 其实这张PPT核心就是底部这句话,过滤掉常见的词语,保留得要的词语。 TextRank学习笔记: 这张PPT主要讲得就是底部这个公式,理解了这个公式就理解整个PPT了,说白了就是一个词I被其它词J引用合计得到一个分数除以其它词J引用除词I之外即词K的分数之和,再乘以词J本
相关文章
相关标签/搜索