关于word2vec 句子相似度计算

时间 2020-12-30

标签 word2vec 句子之间相似度栏目 Microsoft Office 繁體版

原文原文链接

在生成词向量之后，基于词向量计算句子相似度： 1.首先处理句子的重点词汇，排除无关词汇，比如我你他之类的，non_words.txt里面是一些无关词汇 2.接下来根据相关的处理结果，做一个单项匹配首先根据s1的句子，找到是s1中第一个词语的在第二句话中的最大相似值，再依次找到第二个，第三个，取平均值作为s1 ->s2句子的单项匹配 3.最后取双向匹配的平均值作为 s1 和 s2 的句

>>阅读原文<<