文本相似度-NLP

时间 2020-12-21

原文原文链接

前言在自然语言处理过程中，经常会涉及到如何度量两个文本之间的相似性，我们都知道文本是一种高维的语义空间，如何对其进行抽象分解，从而能够站在数学角度去量化其相似性。而有了文本之间相似性的度量方式，我们便可以利用划分法的K-means、基于密度的DBSCAN或者是基于模型的概率方法进行文本之间的聚类分析；另一方面，我们也可以利用文本之间的相似性对大规模语料进行去重预处理，或者找寻某一实体名称的相关名

>>阅读原文<<

1. 【python 走进NLP】文本相似度计算--余弦相似度
2. NLP文本相似度(TF-IDF)
3. 文本相似度
4. 文本相似度度量
5. [NLP] 中文文本类似度实战
6. 文本相似度算法
7. 文本相似度综述
8. 文本相似度判定
9. 浅析文本相似度
10. 计算文本相似度
更多相关文章...
• XSD 仅含文本 - XML Schema 教程
• C# 文本文件的读写 - C#教程
• NewSQL-TiDB相关
• 三篇文章了解 TiDB 技术内幕 —— 谈调度