Python3平均值(mean),方差(var)和标准差(std)

感谢参考原文-http://bjbsair.com/2020-04-01/tech-info/18374.htmlhtml

1.平均值（mean）python

平均值的概念很简单：全部数据之和除以数据点的个数，以此表示数据集的平均大小；其数学定义为3d

平均值计算公式code

如下面10个点的CPU使用率数据为例htm

14 31 16 19 26 14 14 14 11 13

其平均值为17.2blog

2.方差、标准差get

方差这一律念的目的是为了表示数据集中数据点的离散程度；其数学定义为：数学

方差class

标准差与方差同样，表示的也是数据点的离散程度；其在数学上定义为方差的平方根：im

标准差

3.为何使用标准差？

一个标准差 68%，两个标准差 95%, 三个标准差 99%。

标准差定义是整体各单位标准值（ xi）与其平均数（μ）离差平方和的算术平均数的平方根。它反映组内个体间的离散程度。

全部数减去其平均值的平方和，所得结果除以该组数之个数（或个数减一，即变异数），再把所得值开根号，所得之数就是这组数据的标准差。

标准计算公式：

假设有一组数值X₁,X₂,X₃,......Xn（皆为实数），其平均值（算术平均值）为μ，公式如图1。

标准差也被称为标准误差，或者实验标准差，公式为

一个较大的标准差，表明大部分数值和其平均值之间差别较大；一个较小的标准差，表明这些数值较接近平均值。

例如，A、B两组各有6位学生参加同一次语文测验，A组的分数为9五、8五、7五、6五、5五、45，B组的分数为7三、7二、7一、6九、6八、67。这两组的平均数都是70，但A组的标准差约为17.08分，B组的标准差约为2.16分，说明A组学生之间的差距要比B组学生之间的差距大得多。

一个标准差 68%，两个标准差 95%, 三个标准差 99%。

与方差相比，使用标准差来表示数据点的离散程度有3个好处：

表示离散程度的数字与样本数据点的数量级一致，更适合对数据样本造成感性认知。依然以上述10个点的CPU使用率数据为例，其方差约为41，而标准差则为6.4；二者相比较，标准差更适合人理解。
表示离散程度的数字单位与样本数据的单位一致，更方便作后续的分析运算。
在样本数据大体符合正态分布的状况下，标准差具备方便估算的特性：66.7%的数据点落在平均值先后1个标准差的范围内、95%的数据点落在平均值先后2个标准差的范围内，而99%的数据点将会落在平均值先后3个标准差的范围内。

4.python求均值、方差、标准差

#求均值

arr_mean = np.mean(arr)

#求方差

arr_var = np.var(arr)

#求标准差

arr_std = np.std(arr,ddof=1)

print("平均值为：%f" % arr_mean)

print("方差为：%f" % arr_var)

print("标准差为:%f" % arr_std)感谢参考原文-http://bjbsair.com/2020-04-01/tech-info/18374.html

1.平均值（mean）

平均值的概念很简单：全部数据之和除以数据点的个数，以此表示数据集的平均大小；其数学定义为

平均值计算公式

如下面10个点的CPU使用率数据为例

14 31 16 19 26 14 14 14 11 13

其平均值为17.2

2.方差、标准差

方差这一律念的目的是为了表示数据集中数据点的离散程度；其数学定义为：

方差

标准差与方差同样，表示的也是数据点的离散程度；其在数学上定义为方差的平方根：

标准差

3.为何使用标准差？

一个标准差 68%，两个标准差 95%, 三个标准差 99%。

标准差定义是整体各单位标准值（ xi）与其平均数（μ）离差平方和的算术平均数的平方根。它反映组内个体间的离散程度。

全部数减去其平均值的平方和，所得结果除以该组数之个数（或个数减一，即变异数），再把所得值开根号，所得之数就是这组数据的标准差。

标准计算公式：

假设有一组数值X₁,X₂,X₃,......Xn（皆为实数），其平均值（算术平均值）为μ，公式如图1。

标准差也被称为标准误差，或者实验标准差，公式为

一个较大的标准差，表明大部分数值和其平均值之间差别较大；一个较小的标准差，表明这些数值较接近平均值。

一个标准差 68%，两个标准差 95%, 三个标准差 99%。

与方差相比，使用标准差来表示数据点的离散程度有3个好处：

表示离散程度的数字与样本数据点的数量级一致，更适合对数据样本造成感性认知。依然以上述10个点的CPU使用率数据为例，其方差约为41，而标准差则为6.4；二者相比较，标准差更适合人理解。
表示离散程度的数字单位与样本数据的单位一致，更方便作后续的分析运算。
在样本数据大体符合正态分布的状况下，标准差具备方便估算的特性：66.7%的数据点落在平均值先后1个标准差的范围内、95%的数据点落在平均值先后2个标准差的范围内，而99%的数据点将会落在平均值先后3个标准差的范围内。

4.python求均值、方差、标准差

#求均值

arr_mean = np.mean(arr)

#求方差

arr_var = np.var(arr)

#求标准差

arr_std = np.std(arr,ddof=1)

print("平均值为：%f" % arr_mean)

print("方差为：%f" % arr_var)

print("标准差为:%f" % arr_std)