今天的主角是指数分布,由此导出\(\Gamma\)分布,一样,读者应尝试一边阅读,一边独立推导出本文的结论。因为本系列为我独自完成的,缺乏审阅,若是有任何错误,欢迎在评论区中指出,谢谢!函数
指数分布是单参数分布族,整体\(X\sim E(\lambda)\)有时也记做\(\mathrm{Exp}(\lambda)\),此时的整体密度函数为学习
现寻找其充分统计量,样本联合密度函数为spa
由因子分解定理,取code
能够获得\(\bar X\)是\(\lambda\)的充分统计量。可是指数分布的参数并不是均值,而是均值的倒数,因此对\(\bar X\)也有数学
注意,千万不要想固然地认为指望和通常的函数之间是可交换的,即通常来讲\(\mathbb{E}[f(X)]\ne f[\mathbb{E}(X)]\),因此你不能认为\(\bar X^{-1}\)就是\(\lambda\)的无偏估计量。it
每到此时,我就想举对数正态分布的例子:\(X\sim N(0,\sigma^2)\),求\(e^{X}\)的指望。显然有class
\[\begin{aligned} \mathbb{E}(e^{X})&=\int_{-\infty}^\infty e^x\frac{1}{\sqrt{2\pi\sigma^2}}\exp\left\{-\frac{x^2}{2\sigma^2} \right\}\mathrm{d}x\\ &=\int_{-\infty}^\infty \frac{1}{\sqrt{2\pi\sigma^2}}\exp\left\{-\frac{x^2-2\sigma^2x}{2\sigma^2} \right\}\mathrm{d}x\\ &=e^{-\frac{\sigma^2}{2}}\int_{-\infty}^\infty \frac{1}{\sqrt{2\pi\sigma^2}}\exp\left\{-\frac{(x-\sigma^2)^2}{2\sigma^2} \right\}\mathrm{d}x\\ &=e^{-\frac{\sigma^2}{2}}. \end{aligned} \]最后一个等号处,积分是\(N(\sigma^2,\sigma^2)\)的密度函数全积分为1。这说明sed
\[\mathbb{E}(e^{X})=e^{-\frac{\sigma^2}{2}}\ne 1=e^{\mathbb{E}(X)}. \]
一样,也能告诉咱们股票的波动率越大,指望收益也越大。lambda
可是,用\(\bar X^{-1}\)老是有必定道理的,至少在量级上保持了跟待估参数的一致性。若是咱们要进行无偏调整,则须要求出\(\bar X\)的具体密度。不妨设\(T=\sum_{j=1}^n X_j\),则\(T=n\bar X\),若是咱们能求出\(T\)的分布,也同样能得出\(\bar X^{-1}\)的指望。技巧
为求\(T\)的分布,引入一个Jacobi行列式为1的线性变换:
则\((Y_{1},\cdots,Y_{n})\)的联合密度函数为
接下来要依次对\(y_1,\cdots,y_{n-1}\)做积分,为方便计,记
如今,\(y_1\)的积分范围是\((0,y_n-y_{n-1}-\cdots-y_2)=(0,\mathcal B_2)\),即
再对\(y_2\)积分,其积分范围是\((0,\mathcal B_3)\),即
继续下去的步骤就很机械了,对\(y_3\)积分时积分范围是\((0,\mathcal B_4)\),因此
将这个过程一直进行下去,容易获得
进行最后一次积分就能获得\(T\)的密度函数为
这里有一个稍微有点耍赖的技巧。若是你不想一个个积分,而又记住了指数分布和的密度函数形式,则能够用数学概括法验证指数分布和的密度函数恰有如此的形式。
读者能够自行用数学概括法计算一遍,这个计算量是比较小的。
一样,咱们之后会常常跟这个密度函数打交道。由于阶乘只适用于整数,将其解析延拓到\(\mathbb{R}^+\)上有\((n-1)!=\Gamma(n)\),注意到其核为\(e^{-\lambda x}x^{n-1}\),对于任意\(n>0,\lambda >0\),有
因此其正则化因子为\(\frac{\lambda^n}{\Gamma(n)}\)。如今咱们能够正式给出\(\Gamma\)分布的定义:称\(X\sim\Gamma(n,\lambda)\),若是\(X\)具备以下的密度函数:
当\(n\)为整数时,\(\Gamma(n)=(n-1)!\)。同时,咱们获得一个重要结论:若\(X_1,\cdots,X_n\stackrel{\mathrm{i.i.d.}}\sim E(\lambda)\),则
Tlst <- c() for (i in 1:100000){ Tlst[i] <- sum(rexp(5, 3)) # T为5个E(3)样本之和 } plot(density(Tlst), main = "T的样本密度", col = "blue", xlim = c(0, 6)) xlst <- seq(0, 6, 0.00001) ylst <- dgamma(xlst, 5, 3) lines(xlst, ylst, col = "red")
因为\(\Gamma\)分布核函数的特色,其指望和方差也是容易求出的。现设\(X\sim \Gamma(n)\),则
这说明\(n\)越大\(X\)的指望越大,\(\lambda\)越大\(X\)的指望越小,若是将其视为独立指数分布的和也能获得这个结论。
如今回到正题,计算指数分布均值倒数\(\bar X^{-1}\)的指望,先计算\(T^{-1}\)的指望,容易计算获得
所以天然有
所以,\(\bar X^{-1}\)只是\(\lambda\)的渐进无偏估计,能够对它通过无偏处理获得无偏估计:
下面进行\(\hat \lambda\)的有偏估计、无偏估计的模拟计算,从指数分布\(E(2)\)中抽样。为了体现出区别,图中的每个点都是100个估计量的平均值。
rm(list = ls()) unbiased_estimator <- c() biased_estimator <- c() for (j in 1:100){ meanlst <- c() for (i in 1:100){ samples <- rexp(10, 2) # 每次产生10个样本计算均值 meanlst[i] <- 1/mean(samples) } biased_estimator[j] <- mean(meanlst) unbiased_estimator[j] <- 9/10*biased_estimator[j] } split.screen(c(1, 2)) screen(1) plot(biased_estimator, main = "有偏估计", ylim = c(1.5, 2.5)) abline(h = 2, col = "blue") screen(2) plot(unbiased_estimator, main = "无偏估计", ylim = c(1.5, 2.5)) abline(h = 2, col = "blue")
\(\Gamma\)分布与许多分布具备紧密的联系(中心极限定理这种与正态分布的联系就不说了)。与指数分布的联系是显然的:\(\Gamma(1,\lambda)\)就是\(E(\lambda)\),这点从上面的推导能够得出。
须要注意一点:指数分布的参数是其尺度参数。什么意思呢?对于\(X\sim E(\lambda)\),它的分布函数是\(F(x)=1-e^{-\lambda x}\),对其做伸缩变换\(aX\),有
对比\(F(x)\)的形式,发现\(aX\sim E(\lambda /a)\),这就表明伸缩变换不改变指数分布的性质,因此说指数分布的参数是其尺度参数。既然\(\Gamma\)分布是指数分布的直接推广,则\(\Gamma\)分布也具备这样的性质:若\(X\sim \Gamma(n,\lambda)\),则
这样的变换不改变数量参数\(n\),这也是指数分布中获得的直接推广结论。
还记得正态分布的衍生分布——\(\chi^2(n)\)分布吗?以前,由于卡方分布的密度函数过于复杂,很差记忆,因此咱们跳过了,但了解过\(\Gamma\)分布的密度函数后再回看卡方分布,就会有一种熟悉感。
对于\(X\sim \chi^2(n)\),其密度函数为
能够看到,它的核恰好是\(e^{-x}\)的某次方,乘以\(x\)的某次方形式,前面的正则化系数由核决定,所以,\(\chi^2(n)\)分布本质上也是\(\Gamma\)分布的一种特例,即
这样,再记忆\(\chi^2(n)\)分布的密度函数就会显得容易一些了。另外,若是\(2n\)是整数,也能够经过\(\Gamma\)分布的伸缩变换将其变成卡方分布:
最后,因为咱们接下来要进入离散分布的参数估计,在这里也给出一个\(\Gamma\)分布与泊松分布的联系,这个联系在随机过程当中会发挥必定的做用,其证实在数理统计中倒不是特别重要。
若\(N\)定义为知足下列条件的\(n\)值:\(X_1,X_2,\cdots\stackrel{\mathrm{i.i.d.}}\sim E(\lambda)\),
则\(N\sim P(\lambda)\)。
下面给出这个定理的证实,其中的思想能够学习。
设\(\sum_{j=1}^k X_j\)的密度函数为\(p_k(x)\),则因为\(\sum _{j=1}^k X_j\sim \Gamma(k,\lambda)\),因此
\[p_k(x)=\frac{\lambda^k}{\Gamma(n)}x^{k-1}e^{-\lambda x}. \]由全几率公式(连续形式),
\[\begin{aligned} &\quad \mathbb{P}(N=k)\\ &=\mathbb{P}\left(\sum_{j=1}^kX_i\le 1,\sum_{j=1}^{k+1}X_i>1 \right)\\ &=\int_0^1\mathbb{P}\left(\sum_{j=1}^{k+1} X_j>1\bigg|\sum_{j=1}^k X_i=x \right)p_k(x)\mathrm{d}x\\ &=\int_0^1\mathbb{P}(X_{k+1}>1-x)p_k(x)\mathbb{d}x\\ &=\int_0^1e^{-\lambda {(1-x)}}\frac{\lambda^k}{(k-1)!}x^{k-1}e^{-\lambda x}\mathrm{d}x\\ &=\frac{\lambda^k e^{-\lambda}}{(k-1)!}\int_0^1 x^{k-1}\mathrm{d}x\\ &=\frac{\lambda^k}{k!}e^{-\lambda}. \end{aligned} \]这是泊松分布的分布列,故\(N\sim P(\lambda)\)。
在上面两篇文章中,将连续分布的点估计进行了详细的讨论,并引出了次序统计量的分布,介绍了\(\Gamma\)分布与\(\beta\)分布。接下来,咱们将转向离散型分布的参数点估计,看看离散形式下因子分解定理应当如何使用。