Z-score

时间 2020-05-08

标签 score 繁體版

原文原文链接

最近处理数据时，常常用到Z-score处理方法，因此把本身了解到的知识聚集在此，对本身也是个提高，但愿对别人也有所帮助。html

因为Z-score的数据分布知足“正态分布”(N(0,1))，而“正态分布”又被称为“Z-分布”，因此该方法被称为“Z-score”。spa

Z-score是用于作数据规范化处理的一种方法。htm

Z-score又称：零-均值规范化、standardscore、Z-value。blog

Z-score的计算公式以下：ip

(注：本图转载自wikipedia)
其中x是原始数据，u是所有数据的均值，分母为标准方差。it

Z-score的分布以下图所示：io

（注：本图转载自wikipedia）方法

Z-score表示原始数据偏离均值的距离长短，而该距离度量的标准是标准方差。im

Z-score大于零表示该数据大于均值。统计

Z-score小于零表示该数据小于均值。

Z-score等于零表示该数据等于均值。

Z-score等于“1”表示该数据比均值大一个标准方差。

Z-score等于“-1”表示该数据比均值小一个标准方差。

若是统计数据量足够多，Z-score数据分布知足，68%的数据分布在“-1”与“1”之间，95%的数据分布在“-2”与“2”之间，99%的数据分布在“-3”与“3之间”。能够经过此对你的数据作必定的验证。相见上面的Z-score数据分布图。

Z-score可用于数据分布过于凌乱，没法判断最大值与最小值，或者数据中存在过多的奇异点，能够用Z-score方法对数据作规范化处理。

其实Z-score也是一种数据归一化处理的一种方法。

转自：http://blog.sina.com.cn/s/blog_a89e19440101eeuo.html

本文参考以下连接：

http://en.wikipedia.org/wiki/Standard_score

http://stattrek.com/statistics/dictionary.aspx?definition=z_score

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。