【NLP学习笔记】余弦相似度

一、问题:计算两个句子之间的相似度 **基本思路:**如果这两句话的用词越相似,它们的内容就应该越相似。因此,可以从词频入手,计算它们的相似程度。 二、步骤 第一步,分词。 第二步,列出两个句子所有的不重复的词。 第三步,计算词频(TF)。 第四步,写出各个句子的词频向量。 第五步,计算这两个向量的相似程度。 由此可见,句子的相似程度可以使用余弦相似度来进行计算。 三、余弦相似度的原理 我们可以把
相关文章
相关标签/搜索