天然语言处理模型（一）：一文读懂TF-IDF

时间 2020-01-22

标签天然语言处理模型一文读懂 idf 繁體版

原文原文链接

假设咱们手头有大量的文档（或网页）, 一般咱们会比较关心如下几个问题： 1. 每个文档的关键词（或主题词）包括哪些？算法 2. 给定一个（或一组）关键词，与这个（或组）词最相关的文档是哪个？工具 3. 给定一个文档，哪一个（或哪些）文档与它具备最大的类似度呢？spa 回答上述三个问题的关键是：对于一个给定的词和一个给定的文档，定义一个

>>阅读原文<<