余弦相似性计算【转】

    句子A:我喜欢看电视,不喜欢看电影。   句子B:我不喜欢看电视,也不喜欢看电影。 请问怎样才能计算上面两句话的相似程度? 基本思路是:如果这两句话的用词越相似,它们的内容就应该越相似。因此,可以从词频入手,计算它们的相似程度。 第一步,分词。   句子A:我/喜欢/看/电视,不/喜欢/看/电影。   句子B:我/不/喜欢/看/电视,也/不/喜欢/看/电影。 第二步,列出所有的词。   我
相关文章
相关标签/搜索