天然语言处理模型(一):一文读懂TF-IDF

    假设咱们手头有大量的文档(或网页), 一般咱们会比较关心如下几个问题:         1. 每个文档的关键词(或主题词)包括哪些?算法         2. 给定一个(或一组)关键词,与这个(或组)词最相关的文档是哪个?工具         3. 给定一个文档,哪一个(或哪些)文档与它具备最大的类似度呢?spa     回答上述三个问题的关键是:对于一个给定的词和一个给定的文档,定义一个
相关文章
相关标签/搜索