【机器学习课程-华盛顿大学】:4 聚类和检索 4.2 LSH局部敏感哈希

kd-tree:在高维数据时很难处理,而且搜索难度高。   1、LSH是一种找到近似邻居的方法。 比如以下这种情况,找不到真正的最近邻。因为我们只在要寻找的点所在的bin中找最近邻。   2、3个挑战: (1)分割线很难找 (2)质量函数很差时,很难解决:2个点离的很近,但被分到了2个bin中,很难解决 (3)计算量有时候很大:有时候1个bin中分的数据太多   3、提高效率:减少每次查询的点数
相关文章
相关标签/搜索