异常点检测 孤立森林(isolation forest)

先说重点 1、孤立森林是一种适用于连续数据的无监督异常检测方法 2、孤立森林,不再是描述正常的样本点(给出一个正常样本在特征空间中的区域,对于不在这个区域中的样本,视为异常),而是要孤立异常点。 3、根据‘高密度的簇是需要被切很多次才能被孤立,低密度的点被切分较少次就可以被孤立’的原理,最终算法比较路径长度的平均值即可捕获异常点。 4、对小数据集能取得更好的效果。样本数较多会降低孤立森林孤立异常点
相关文章
相关标签/搜索