SimHash , 用于文本的局部敏感哈希

简介 1. min-wise independent permutations 2.SimHash SimHash适用于 可以用若干个<特征,权重> 对来表示的样本, 如 object={<f1,w1>,...,<fm,wm>}(1) f 为 feature, w 为 weight. 那么可以通过 SimHash 来得到它的 fingerpoint. 设定fingerpoint的维度d=64. 输
相关文章
相关标签/搜索