聚类算法之DBSCAN算法之二:高维数据剪枝应用NQ-DBSCAN

一、经典DBSCAN的不足 1.由于“维度灾难”问题,应用高维数据效果不佳 2.运行时间在寻找每个点的最近邻和密度计算,复杂度是O(n2)。当d>=3时,由于BCP等数学问题出现,时间复杂度会急剧上升到Ω(n的四分之三次方)。 二、DBSCAN在高维数据的改进 目前的研究有Grid-based和approx等方向,基于Grid-based结构的有Fast-DBSCAN,时间复杂度最坏是O(n*lo
相关文章
相关标签/搜索