随机变量及其分布
1 ) 知识图谱
备注:图片托管于github,请确保网络的可访问性
2 ) 相关概念
- 随机变量:如果随机试验的结果可以用一个变量来标识,那么这样的变量叫做随机变量。随机变量常用字母
X,Y,ξ,η 等表示
- 离散型随机变量:对于随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量.
- 连续型随机变量:对于随机变量可能取的值,可以取某一区间内的一切值,这样的变量叫做连续型随机变量.
- 离散型随机变量与连续型随机变量的区别和联系:离散型随机变量与连续型随机变量都是用变量表示随机试验的结果,但是离散型随机变量的结果可以按一定次序一一列出,而连续型随机变量的结果不可以一一列出
- 若X是随机变量,Y = aX + b (a,b是常数), 则Y也是随机变量,并且不改变其属性(离散型,连续型)
3 ) 离散型随机变量的分布列
概率分布(分布列)
设离散型随机变量X可能取的不同值为
x1,x2,...,xi,...,xn,X的每一个值
xi (i = 1,2,…,n)的概率
P(X=xi)=pi, 则称下表为随机变量X的概率分布,简称X的分布列
X |
x1 |
x2 |
... |
xi |
... |
xn |
P |
p1 |
p2 |
... |
pi |
... |
pn |
性质
-
pi>=0,i=1,2,...,n;
-
∑i=1npi=1
两点分布
如果随机变量X的分布列为下表,则称X服从两点分布,并称p = P(X=1) 为成功概率
二项分布
- 如果一次实验中某时间发生的概率是p, 那么在n次独立重复实验中这个事件恰好发生k次的概率是
P(X=k)=Cnkpk(1−p)n−k, 其中k=0,1,2,…,n, q = 1-p
- 于是得到随机变量X的概率分布如下
- X: 0, 1, …, k, …, n
- P:
Cn0p0qn,Cn1p1qn−1,...,Cnkpkqn−k,...,Cnnpnq0
- 我们称这样的随机变量X服从二项分布,记为:
X B(n,p), 并称 p 为成功概率
- 判断一个随机变量是否服从二项分布,关键有三点:
- 对立性: 即一次试验中事件发生与否二者必居其一
- 重复性: 即试验是独立重复地进行了n次
- 等概率性: 在每次试验中事件发生的概率相等
- 注意:二项分布的模型是有放回抽样,二项分布中的参数是p,k,n
4 ) 离散型随机变量的均值与方差
离散型随机变量的均值
- 一般地,若离散型随机变量X的分布列为
- X:
x1,x2,...,xi,...,xn
- P:
p1,p2,...,pi,...,pn
- 则称
E(X)=x1p1+x2p2+...+xipi+...+xnpn 为离散型随机变量X的均值或者数学期望
- 它反映了离散型随机变量取值的平均水平
性质:
-
E(aX+b)=aE(x)+b
- 若X服从两点分布,则
E(X)=p
- 若X~B(n,p), 则
E(X)=np
离散型随机变量的方差
- 一般地,若离散型随机变量X的分布列为:
- X:
x1,x2,...,xi,...,xn
- P:
p1,p2,...,pi,...,pn
- 则称
D(x)=∑i=1n(xi−E(x))2pi 为随机变量X的方差,并称其算术平方根
D(X)
为随机变量X的标准差
- 它反映了离散型随机变量取值的稳定与波动,集中与离散的程度
- D(X)越小,X的稳定性越高,波动越小,取值越集中
- D(X)越大,X的稳定性越差,波动越大,取值越分散
性质
-
D(aX+b)=a2D(X)
- 若X服从两点分布,则
D(X)=p(1−P)
- 若X~B(n,p), 则
D(X)=np(1−P)
5 ) 正态分布
- 正态变量概率密度曲线函数表达式
f(x)=2π
∗σ1e−2σ2(x−μ)2,x∈R
- 其中
μ,σ是参数,且
σ>0,−∞<μ<+∞. 记为:
N(μ,σ2), 如下图
备注:图片托管于github,请确保网络的可访问性
- 若随机变量X服从一个数学期望为μ、方差为
σ2的正态分布,记为
N(μ,σ2)
- 其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度
- 当μ = 0,σ = 1时的正态分布是标准正态分布