随机投影森林-一种近似最近邻方法(ANN)

当数据个数比较大的时候,线性搜索寻找KNN的时间开销太大,而且需要读取所有的数据在内存中,这是不现实的。因此,实际工程上,使用近似最近邻也就是ANN问题。其中一种方法是利用随机投影树,对所有的数据进行划分,将每次搜索与计算的点的数目减小到一个可接受的范围,然后建立多个随机投影树构成随机投影森林,将森林的综合结果作为最终的结果。 ​建立一棵随机投影树的过程大致如下(以二维空间为例): 随机选取一个从
相关文章
相关标签/搜索