第7-1课:余弦相似度与相似算法(图文篇)

相似度算法是计算个体之间相似程度的算法,此类算法多如牛毛,这里我们只讨论用于处理文字之间相似度的算法。文本之间的相似度计算应用广泛,比如论文抄袭的判断,就可以用相似度算法先预筛查一遍;再比如网站的文章自动分类,就是根据相似度将文章自动分入科技、体育、军事等类别中。此外,广告推送、订单识别等场合,也会用到文本相似度的判断。 余弦相似度(余弦距离) 通常用于判断相似度的理论有很多,比如欧氏距离、余弦相
相关文章
相关标签/搜索