计算文本相似度

不仅要考虑语义,还要考虑顺序。 计算距离的方式:余弦,欧式 1.向量表示 (1)Distributed representation 最大的贡献就是让相关或者相似的词,在距离上更接近了。 (2)word2vec模型: 通过神经网络机器学习算法来训练N-gram 语言模型,并在训练过程中求出word所对应的vector的方法。利用了词的上下文,语义信息更为丰富. 由于文本的长度各异,我们可能需要利用
相关文章
相关标签/搜索