文本类似度计算(二):hash方法

文本类似度计算 BooI模型 tf-idf模型(增长词权重特征) BM25 模型(增长了长度特征) Proximity 模型(增长了位置特征) 语义特征模型(增长了 Topic特征) 句法特征模型(增长了句法特征) 深度表示模型(增长语义特征) 这一篇都是参考(抄)《文本上的算法》(路彦雄) Hash 方法主要有 minhash 和 simhash。 minhash 的主要目的是降维,它的主要原理
相关文章
相关标签/搜索