几率笔记6——多维随机变量

  和其它问题同样,几率也可能同时受到多个条件的影响,例如考察某地区中学生的身体素质,随机地选取一名学生,观察学生的身高 X,体重 Y 和肺活量 Z 等指标。随机变量 X,Y,Z 来自同同样本空间,它们的取值可能相互影响。像这样同时考虑的多个随机变量,称为多维随机变量。本章以二维随机变量为例,介绍多维随机变量的相关概念。函数

联合分布

  和一维变量的几率分布相似,联合分布把舞台扩展到了多维,这里的“联合”就是多个随机变量的意思。post

  假设一个事件受到两个变量x和y的影响,它的联合分布定义为:学习

  其中X表示具体的取值,x表示变量。spa

  上一章提到过,分布是指几率的累加,是把事件映射为数字,一个二维联合分布的变量取值范围是整个二维平面,但F(x,y)的取值范围是0~1。3d

离散型

联合几率

  联合几率指的是包含多个条件且全部条件同时成立的几率,也叫联合分布率。blog

  用xi和yj的两个随机变量全部可能的取值,P(X=xi, Y=yj)表示在X=xi和Y=yj下事件发生的几率。设P(X=xi, Y=yj)=pij,则下表是二维离散型随机变量(X, Y)的联合几率:事件

  联合分布率其实是一个矩阵。既然是几率,联合几率也知足下面两个条件:get

联合分布

  一维随机变量的分布函数:class

  二维随机变量的分布函数:变量

  其中:

  分布函数和分布略有区别,“分布”是指累加几率,“分布函数”是将累加几率函数化。F(x,y)=P{X≤x,Y≤y}是分布函数,它的值是全部在X≤x,Y≤y下的几率分布。

边缘分布

  先看表1的第一行,它固定了x=x1,此时在表格右侧加入一列:

  p1·表示x的取值固定,y取任意值时的几率分布,即:

  因为p1·是写在表格的边缘,因此称为x=x1的边缘分布。对于任意行来讲:

  这其实是在表示X= xi时事件发生的几率。相似的,y=yj的边缘分布是:

条件几率

  条件几率是指在A事件发生的条件下,事件B发生的几率,表示为P(B|A),它有一个重要公式:

  多维随机变量的条件几率公式与此相似,在Y=yj 条件下X=xi的几率:

独立性

  对于二维离散型随机变量(X, Y)来讲,若是知足:

  那么这两个随机变量之间是没有相互影响的,称X和Y之间互相独立。反过来也同样,若是知足了独立性,那么必然有上式的关系。

连续型

  因为是连续型变量,因此没法像离散型变量那样简单地计算在某一点的几率(几率能够表示为几何度量,点的度量是0,所以算某一点的几率也是0,或者说计算点的几率没有意义),只能计算某一取值范围内的几率,也就是几率分布(几率的累加)。

联合几率密度函数和联合分布

  某个地区的人口密度越大,这个地区的人口越多。一样的,几率密度越大,说明这个区域的发生某件事的几率越大。

  设F(x,y)是二维连续型随机变量(X,Y)的联合分布函数,若是存在一个非负函数f(x,y),对于任意实数x,y,有:

  则称f(x,y)是二维连续型随机变量(X,Y)的联合几率密度函数。

  u和v在计算后定积分后会被x和y代替。能够对比上一章中一维随机变量的分布函数来理解F(x,y)。几率分布是几率的累加,而累加正好是积分的定义。在几何上,F(x,y)表示了曲面柱体的体积:

  假设在R区域上,x1<x<x2, y1<y<y2,那么该区域上的几率分布是:

  dydx是R上的面积积元,它是面积无限接近0的小矩形,但不是0。至此,几率和多重积分联系到一块儿。上式中没有u和v,这是因为已经肯定了x和y的取值范围,且f原本就是关于x和y的函数,所以不必再引入u和v。若是非要使用u和v,那么上式等价于:

  因为F是分布函数,所以在整个定义域上知足:

边缘分布和边缘密度函数

  联合分布表达的是二维随机变量(X, Y)的总体分布,同时X和Y也有各自的边缘分布。与离散型相似,连续型随机变量的边缘分布是只认为有一个变量,其它变量都看做常量。

  X的边缘分布,表示将x看做常量,无论Y的取值:

  Y的边缘分布,表示将y看做常量,无论x的取值:

  设(X, Y)的联合密度函数是f(x,y),那么(X, Y)的联合分布能够表示为:

  X的边缘分布限定了X的取值是X≤x,y能够取任意值,此时X的边缘分布能够写成:

  分布表明了累加,连续型分布是用积分表示的,FX(x)表示P{X≤x, Y<∞}的累加,是对dx的积分,所以X的边缘分布的密度函数是上式的内积分:

  把u,v换成x,y,X的边缘分布的密度函数是:

  相似的,Y的边缘分布的密度函数是:

条件分布和条件密度函数

  条件几率公式:

  对于连续型变量来讲,单点的几率没有意义,所以将上式推广到连续型随机变量后就变成了“分布”,好比给定Y值的条件下X的几率分布。

  设(X, Y)的联合密度函数是f(x,y),边缘密度函数是fX(x)和fY(y),若是固定x,则称下式为X=x条件下Y的几率密度:

  一样,Y=y条件下X的几率密度:

  有了几率密度,天然能够求得相应的分布,给定Y值的条件下X的几率分布:

独立性

  对于二维连续型随机变量(X, Y)来讲,若是知足:

  那么这两个随机变量之间是没有相互影响的,称X和Y之间互相独立。反过来也同样,若是知足了独立性,那么必然有上式的关系。

二维均匀分布

  设R是平面上的有界区域,面积为A,若二维随机变量(X,Y)具备几率密度:

  则称(X, Y)在R上服从均匀分布。

  若是在R区域上x在x1<x<x2上服从均匀分布,那么X在x1<x<x2的边缘分布的密度函数是:

  若(X, Y) 服从R区域上的均匀分布,则对于R上的任一子区域D,都有:

  上式其实是在说,若是(X,Y)在某个区域内服从均匀分布,则意味着(X,Y)在该区域内具备“等可能”性。

二维正态分布

  若二维随机变量(X,Y)具备几率密度:

  则称(X,Y)服从参数为 的二维正态分布,记做:

  f(x,y)的是一个倒钟型曲面:

示例

示例1

  X服从(0,1)上的均匀分布,在X=x(0<x<1)的条件下,Y在(0,x)内服从均匀分布,f(x,y)=?, 2. fY(y)=?

  先看1,X服从某一个区域的边缘分布意味着:

  X服从(0,1)上的均匀分布,则x1 = 0, x2 = 1:

  “Y在(0,x)内服从均匀分布”:

  

  2. Y的边缘分布的密度函数是:

  如今只须要肯定的积分域便可,由0<y<x<1可知,积分上限是1,下限是y:

示例2

  设二维随机变量(X, Y)的联合几率密度是:

  1. A=? 2.求分布函数F(x,y) 3.求几率P{Y≤X}

  

  1. 整个定义域上分布函数知足:


  做者:我是8位的

  出处:http://www.cnblogs.com/bigmonkey

  本文以学习、研究和分享为主,如需转载,请联系本人,标明做者和出处,非商业用途! 

  扫描二维码关注公众号“我是8位的”

相关文章
相关标签/搜索