(算法)海量文章中找出相似文章-TF-IDF与余弦相似性的应用(二)

转载来自:http://www.ruanyifeng.com/blog/2013/03/cosine_similarity.html 今天,我们再来研究另一个相关的问题。有些时候,除了找到关键词,我们还希望找到与原文章相似的其他文章。比如,"Google新闻"在主新闻下方,还提供多条相似的新闻。 为了找出相似的文章,需要用到"余弦相似性"(cosine similiarity)。下面,我举一个例子
相关文章
相关标签/搜索