几率统计：数学指望、方差、协方差、相关系数、矩

时间 2019-11-11

标签几率统计数学指望方差协方差相关系数栏目应用数学繁體版

原文原文链接

摘要：最近在学习机器学习/数据挖掘的算法,在看一些paper的时候常常会遇到之前学过的数学公式或者名词,又是老是想不起来,因此在此记录下本身的数学复习过程,方便后面查阅。算法

数学指望是随机变量的重要特征之一,随机变量X的数学指望记为E(X),E(X)是X的算术平均的近似值,数学指望表示了X的平均值大小。机器学习

数学指望给出了随机变量的平均大小,现实生活中咱们还常常关心随机变量的取值在均值周围的散布程度,而方差就是这样的一个数字特征。学习

设X是随机变量,而且E{[X-E(X)²]}存在,则称它为X的方差,记为D(X)。3d

方差的算术平方根为X的标准差。blog

另外,D(X) = E{[X-E(X)²]} 通过化解可得 D(X) = E(X²) – [E(X)]² .咱们通常计算的时候经常使用这个式子。get

对于二维的随机变量(X,Y)，咱们还要讨论它们的相互关系,协方差就是一个这样的数字特征。数学

由于E{[X-E(X)][Y-E[Y]]} = E(XY) – E(X)E(Y).it

又当X,Y相互独立的时候E(XY) = E(X)E(Y).这意味着若E{[X-E(X)][Y-E[Y]]} ≠ 0 ,则X与Y是存在必定关系的。数据挖掘

咱们把E{[X-E(X)][Y-E[Y]]} 称为随机变量X与Y的协方差。记为Cov(X,Y).变量

即：Cov(X,Y) = E{[X-E(X)][Y-E[Y]]}

协方差在某种意义上是表示了两个随机变量间的关系,可是Cov(X,Y)的取值大小与X,Y的量纲有关,不方便分析,因此为了不这一点,咱们用X,Y的标准化随机变量来讨论。

咱们称为随机变量X与Y的相关系数,记为(无量纲)。

其中为X,Y的协方差即Cov(X,Y),D(X),D(Y)分别是X,Y的方差且D(X)>0，D(Y)>0。

关于相关系数，咱们有下面的性质：

注意：两个不相关的随机变量，不必定相互独立,有一特殊状况是,当随机变量X,Y服从二维正态分布的时候,独立与不相关等价。

矩(moment)是最普遍的一种数字特征,经常使用的矩有两种：原点矩和中心矩。

原点矩：

对于正整数k，称随机变量X的k次幂的数学指望为X的k阶原点矩：即 E(X^k) ,k=1,2,…n.

数学指望就是一阶原点矩。

中心矩：

对于正整数k，称随机变量X与E（X）差的k次幂的数学指望为X的k阶中心矩：即 E{X-E[X^K]},K=1,2,…n.

方差就是二阶中心矩。