Gibbs sampling

时间 2019-11-11

标签 gibbs sampling 繁體版

原文原文链接

　Gibbs sampling(吉布斯采样)(资料集合)算法

　　维基百科，自由的百科全书:app

　　In statistics, Gibbs sampling or a Gibbs sampler is a Markov chain Monte Carlo (MCMC) algorithm for obtaining a sequence of observations which are approximated from a specified multivariate probability distribution, when direct sampling is difficult. This sequence can be used to approximate the joint distribution (e.g., to generate a histogram of the distribution); to approximate the marginal distribution of one of the variables, or some subset of the variables (for example, the unknown parameters or latent variables); or to compute an integral (such as the expected value of one of the variables). Typically, some of the variables correspond to observations whose values are known, and hence do not need to be sampled.函数

　　在统计学上，吉布斯取样或吉布斯取样器是马尔科夫链蒙特卡罗（MCMC）算法，用于得到从特定的多变量几率分布近似的观测序列，当直接取样困难时。该序列可用于近似联合分布（例如，生成分布的直方图）; 近似一个变量的边际分布，或变量的一些子集（例如，未知参数或潜在变量）; 或以计算积分（如预期值的变量之一的）。一般，一些变量对应于其值是已知的观察值，所以不须要进行采样。Gibbs抽样是经常使用的一种手段统计推断，特别是贝叶斯推理。它是一种随机算法（即便用随机数的算法），而且是用于统计推断的肯定性算法的替代，例如指望最大化算法（EM）。如同其它MCMC算法，Gibbs抽样产生马尔可夫链样品，其中的每个的相关性与附近的样品。所以，若是须要独立的样品，则必须当心（一般经过仅取每一个第n个值，例如每100个值）稀释所获得的样品链。此外，从链的开始（老化期）开始的样本可能不能准确地表示所需的分布。post

　　MCMC是用于构建 Markov chain随机几率分布的抽样的一类算法。MCMC有不少算法，其中比较流行的是Metropolis-Hastings Algorithm，Gibbs Sampling是Metropolis-Hastings Algorithm的一种特殊状况。
　　Markov chain 是一组事件的集合，在这个集合中，事件是一个接一个发生的，而且下一个事件的发生，只由当前发生的事件决定。用数学符号表示就是：
　　　　A={ a1,a2 … ai, ai+1,… at }
　　　　P(ai+1| a1,a2,…ai) = P(ai+1| ai)
　　这里的ai不必定是一个数字，它有多是一个向量，或者一个矩阵，例如咱们比较感兴趣的问题里ai=（g, u, b）这里g表示基因的效应，u表示环境效应，b表示固定效应，假设咱们研究的一个群体，g，u，b的联合分布用π（a）表示。事实上，咱们研究QTL，就是要找到π（a），可是有时候π（a）并非那么好找的，特别是咱们要估计的a的参数的个数多于研究的个体数的时候。用通常的least square每每效果不是那么好。
解决方案：
　　用一种叫Markov chain Monte Carlo (MCMC)的方法产生Markov chain，产生的Markov chain{a1,a2 … ai, ai+1,… at }具备以下性质：当t 很大时，好比10000，那么at ~ π（a），这样的话若是咱们产生一个markov chain：{a1,a2 … ai, ai+1,… a10000}，那么咱们取后面9000个样本的平均 a_hat = (g_hat,u_hat,b_hat) = ∑ai / 9000 (i=1001,1002, … 10000)这里g_hat, u_hat, b_hat 就是基因效应，环境效应，以及固定效应的估计值
　　MCMC算法的关键是两个函数：
　　1） q（ai, ai+1），这个函数决定怎么基于ai获得ai+1
　　2） α（ai, ai+1），这个函数决定获得的ai+1是否保留
　　目的是使得at的分布收敛于π（a）
　　Gibbs Sampling的算法：
　　通常来讲咱们一般不知道π（a），但咱们能够获得p（g | u , b）,p(u | g , b), p ( b | g, u )即三个变量的posterior distribution
　　Step1: 给g, u, b 赋初始值：（g0,u0,b0）
　　Step2: 利用p (g | u0, b0) 产生g1
　　Step3: 利用p (u | g1, b0) 产生u1
　　Step4: 利用p (b | g1, u1) 产生b1
　　Step5: 重复step2~step5 这样咱们就能够获得一个markov chain {a1,a2 … ai, ai+1,… at}
　　这里的q（ai, ai+1）= p（g | u , b）* p(u | g , b)* p ( b | g, u )学习

　　For Example:spa

　　这里通俗点的解释一下。首先，什么是sampling.sampling就是以必定的几率分布,看发生什么事件.举一个例子.甲只能E：吃饭、学习、打球,时间T：上午、下午、晚上,天气W：晴朗、刮风、下雨。如今要一个sample,这个sample能够是：打球+下午+晴朗..事件

　　问题是咱们不知道p(E,T,W),或者说,不知道三件事的联合分布.固然,若是知道的话,就没有必要用gibbs sampling了.可是,咱们知道三件事的conditional distribution.也就是说,p(E|T,W),p(T|E,W),p(W|E,T).如今要作的就是经过这三个已知的条件分布,再用gibbs sampling的方法,获得joint distribution.ci

　　具体方法.首先随便初始化一个组合,i.e.学习+晚上+刮风,而后依条件几率改变其中的一个变量.具体说,假设咱们知道晚上+刮风,咱们给E生成一个变量,好比,学习-》吃饭.咱们再依条件几率改下一个变量,根据学习+刮风,把晚上变成上午.相似地,把刮风变成刮风（固然能够变成相同的变量）.这样学习+晚上+刮风-》吃饭+上午+刮风.数学

　　一样的方法,获得一个序列,每一个单元包含三个变量,也就是一个马尔可夫链.而后跳过初始的必定数量的单元（好比100个）,而后隔必定的数量取一个单元（好比隔20个取1个）.这样sample到的单元,是逼近联合分布的.it