9.1_异常值检测

异常值检测(anomaly detection)

  1. 最经常使用的是欺诈检测 fraud detection
  2. 如何求到ε?

高斯分布(正态分布)

1.钟型的面积是1
2.参数估计
3.方差的含义:(样本减去平均值)的平方 再求平均

blog


高斯分布实现异常值检测

1.选择出特征量,你认为是能够检测出异常值的
2.求出每个参数的方差和。
3.求积获得P
4.把检测值放入P中,与ε比较
io


如何选择特征变量(知足高斯模式)

1.log,平方,开方 使得数据呈现高斯状态
2.偏差分析: 当遇到异常值和正常值计算出的P都很大的时候,采起增长新的特征,eg数据中心
变量


多元高斯分布(multivariate)

1.缘由:检测不出来
2.如何:不将p1,p2分开im

相关文章
相关标签/搜索