Algorithm:SimHash算法+倒排索引

1、SimHash算法 一、SimHash算法五个步骤 算法 二、抽屉原理 图中随机的五个点(x,y),其中x和y均非奇即偶, 原理:其中,至少有两个点确定有属于同一个类别好比(奇数,偶数),两点加起来除以2,由于奇数相加/二、偶数相加/2都是整数,中间的即为格子点。只有当x一、x2(或y一、y2)属于不一样类型的时候,好比(奇数+偶数)不可以除以2。因此,要从图中五个点中找到同类型的点便可,而点
相关文章
相关标签/搜索