统计4：显著性检验

时间 2019-12-04

标签统计显著检验繁體版

原文原文链接

在统计学中，显著性检验是“假设检验”中最经常使用的一种，显著性检验是用于检测科学实验中实验组与对照组之间是否有差别以及差别是否显著的办法。html

一，假设检验

显著性检验是假设检验的一种，那什么是假设检验？假设检验就是事先对整体（随机变量）的参数或整体分布形式作出一个假设，而后利用样本信息来判断这个假设是否合理。函数

在验证假设的过程当中，老是提出两个相互对立的假设，把要检验的假设称做原假设，记做H0，把与H0对立的假设称做备择假设，记做H1。假设检验须要解决的问题是：指定一个合理的检验法则，利用已知样本的数据做出决策，是接受假设H0，仍是拒绝假设H0。spa

1，假设检验的基本思想code

假设检验的基本思想是小几率反证法思想。小几率思想是指小几率事件（P<0.01或P<0.05）在一次试验中基本上不会发生。反证法思想是先提出原假设(记做假设H0)，再用适当的统计方法肯定原假设成立的可能性大小：

若可能性小，则认为原假设不成立；若可能性大，则认为原假设是成立的。

2，假设检验的思路

假设检验思路是：先假设，后检验，通俗地

来讲就是要先对数据作一个假设，而后用检验来检查假设对不对。通常而言，把要检验的假设称之为原假设，记为H0；把与H0相对对立（相反）的假设称之为备择假设，记为H1。

若是原假设为真，而检验的结论却劝你拒绝原假设，把这种错误称之为第一类错误（弃真），一般把第一类错误出现的几率记为α；就是说，拒绝真假设的几率是α。
若是原假设不真，而检验的结论却劝你接受原假设，把这种错误称之为第二类错误（取伪），一般把第二类错误出现的几率记为β；就是说，接受假假设的几率是β。

所以，在肯定检验法则时，应尽量使犯这两类错误的几率都较小。通常来讲，当样本容量固定时，若是减小犯一类错误的几率，则犯另外一类错误的几率每每增大。若是要使犯两类错误的几率都减小，除非增长样本容量。

二，显著性检验

什么是显著性检验？在给定样本容量的状况下，咱们老是控制犯第一类错误的几率α，这种只对犯第一类错误的几率加以控制，而不考虑犯第二类错误的几率β的检验，称做显著性检验。几率α称为显著性水平，显著性水平是数学界约定俗成的，一般取值有α =5%，2.5%，1% ，表明着显著性检验的结论错误率必须低于5%、2.5%和1%。在统计学中，一般把在现实世界中发生概率小于5%的事件称之为“不可能事件”。orm

通常状况下，根据研究的问题，若是拒绝真假设的损失大，为减小这类错误，α取值小些，把拒绝真假设的几率降到最低；反之，α取值大些。htm

在显著性检验中，须要用到检验统计量，根据检验法则来肯定统计量，经常使用的统计量是Z统计量和t统计量。当检验统计量取某个区域C中的值时，拒绝原假设H0，则称区域C为拒绝域，拒绝域的边界点称为临界点。blog

显著性检验一般分为两大类：临界值法和p值法。事件

三，检验统计量

在统计学中，检验统计量是用于检验假设的参数是否正确的统计量，检验统计量服从一个给定的几率分布。经常使用的检验统计量有t统计量、Z统计量和卡方统计量等。文档

根据显著性水平，确认检验统计量的拒绝域的临界点，统计决策所依据的规则以下：get

(1)给定显著性水平α，查表得出相应的临界值

或

，

或

；

(2)将检验统计量的值与α水平的临界值进行比较；若是检验统计量取拒绝域中的值，则拒绝原假设。

1，Z检验统计量

设统计量 Z，n为样本容量，μ0为样本均值，σ为标准差，那么Z服从标准正态分布，即Z~N(0,1)，这就是在假设检验中用到的Z检验统计量。

经常使用于方差σ²已知，而均值μ未知的问题。

2，t检验统计量

设统计量t，那么该统计量服从t分布，即t~t(n-1)，这就是假设检验中常常用到得t检验统计量。

经常使用于方差σ²未知，而均值μ已知的问题。

3，卡方检验统计量

设卡方统计量χ2，那么该统计量服从卡方分布，即χ2~χ2(n-1)，这就是假设检验中常常用到得卡方检验统计量。

4，F检验统计量

四，临界法

使用临界法处理参数的假设检验问题的步骤以下：

根据实际问题的要求，提出原假设H0和备择假设H1；
给定显著性水平 α 以及样本容量n；
肯定检验统计量的形式：构造检验统计量，收集样本数据，计算检验统计量的样本观察值。
肯定拒绝域的形式：按P{当H0为真拒绝H0}<=α 求出拒绝域；
根据样本观测值作出决策，是接受H0仍是拒绝H0。

五，显著性检验的实例分析（使用临界点法来检验假设）

某车间用一台包装机装糖，袋装糖的净重是一个随机变量，它服从正态分布。当机器正常时，其均值为0.5（kg），标准差为 0.015（kg）。某日开工后，为检验包装机是否工做正常，随机地抽取它所包装的9袋糖，称得净重为（kg）

0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512

问机器是否正常？

1，分析思路

以μ，σ分别表示这一天袋装糖的净重整体X的均值和标准差。因为长期实践代表标准差比较稳定，设σ=0.015，因而X~N(μ, 0.015²)，而整体的均值μ未知。

关键点：整体服从正态分布，方差已知，而指望未知。

咱们假设整体的均值μ₀=0.5，根据样原本检验假设是否成立，即设原假设 H0：μ=0.5 和备择假设 H1：μ!=0.5

因为要检验的假设涉及到整体均值，那么使用哪一个统计量来检验整体均值呢？答案是使用样本均值，缘由主要是有如下两个：

样本均值是整体均值μ的无偏估计，的观察值的大小在必定程度上反映了μ的大小，
若是原假设H0为真，则观察值与的 μ₀的误差|- μ₀| 通常不会太大；若是 |- μ₀| 过度大，就有理由怀疑假设H0的正确性而拒绝H0。

因此，考虑使用样本均值来检验整体均值。

根据实际问题，选择合适的统计量，选择的标准是：无偏性、可计算差值

样本的观察值共有9个，用R很容易计算出样本的均值=0.512，这个样本均值是统计量。

> x <- c(0.497, 0.518, 0.524, 0.498, 0.511, 0.520, 0.515, 0.512)
> mean(x)
[1] 0.511875

因为样本的均值大于0.5，是否能够判断出今天的机器不正常？不能，这是由于计算的均值是经过抽样获取的，既然是样本，就可能存在偏差，不能直接使用样本的均值来做判断。

也就是说：因为作出决策的依据是一个样本，当实际上H0为真时，仍可能作出拒绝H0的决策，这种错误是没法消除的。

教材是这样说的：样本是进行统计推断的依据，在引用时，每每不是直接使用样本自己，而是针对不一样的问题构造样本的适当函数，利用这些样本的函数进行统计推断。

你能看懂吗，每一个字都认识，就是看不懂。

说人话：经过样本计算的统计量是有偏差的，对本例而言，样本的均值=0.512 是有偏差的，这种偏差是没法消除。所以，不能直接使用样原本检验假设。

敲黑板，划重点：假定有一个整体数据，若是从整体中屡次抽样，那么理论上，每次抽样所获得的统计量（如指望）与整体参数（如指望）应该差异不大，大体围绕在整体参数中心，呈正态分布。就是说，样本统计量和整体参数的差值呈正态分布。

因为没法排除犯这类错误的可能性，所以，须要把犯这类错误的几率控制在必定限度以内，即给出一个较小的数 α (一般的取值有5%，2.5%，和1%)，使犯这类错误的几率不超过α，即便得： P{ 当H0为真时拒绝H0 } <= α，设 α=5%。

说人话：根据样本计算出来的统计量服从必定的分布，即抽样分布，根据抽样分布来计算几率。若是统计量的几率小于α，那么接受H0，认为原假设H0是正确的。

当计算样本统计的几率时，须要用到检验统计量，检验统计量最好是差值，即样本统计量和整体的相应统计量的差值，根据差值的分布来检验假设。

本例使用Z统计量，Z统计量是样本统计量的函数，服从N(0, 1)，S是样本标准差，n是样本容量，μ₀是整体均值

接下来就是根据显著性水平α来肯定分位点，正态分布是左右对称的，因此分位点应该取几率的 α/2 处。

对于正态分布，根据中心极限定理，假设整体均值为0，若是屡次抽样，每次抽样获得的均值都应该在0附近，若是偏离0太远，那颇有可能并不是来自这个整体。

也就是说，Z统计量的几率低于α=5%，接受原假设H0，从图中能够得出最小的检验统计量的值 Z_α/2=1.96，因为可得检验统计量拒绝域是大于1.96或小于 -1.96

根据样本的均值计算检验统计量的值是：2.4=（0.512-0.5）/（0.015/3），样本的检验统计量位于拒绝域中，所以，拒绝原假设，认为今天的机器有问题。

2，具体的步骤

step1，根据实际问题提出原假设H0和备择假设H1

设常量：μ₀=0.5，为此，提出两个对立的假设：

原假设 H0：μ=μ₀

备择假设 H1：μ!=μ₀

step2，肯定检验统计量

由于要检验的假设涉及到整体均值 μ，因此，考虑借助样本均值这一统计量来判断整体的均值。

因为是μ的无偏估计，的观察值的大小在必定程度上反映了μ的大小，所以，若是原假设H0为真，则观察值与的 μ₀的误差|- μ₀| 通常不会太大；若是 |- μ₀| 过度大，就有理由怀疑假设H0的正确性而拒绝H0。

考虑当H0为真时，Z统计量服从N(0,1)，即 Z ~N(0,1)

S是样本的标准差，本例中S=σ=0.015。把Z做为检验统计量，衡量|- μ₀| 的大小归结为衡量统计量Z的大小。

step2，肯定显著性水平和样本容量

设显著性水平α=0.05，样本容量n=9

step4：肯定拒绝域的形式

适当选定一正数k，使得当观察值

就接受原假设H0，不然就拒绝原假设H0。

然而，因为作出决策的依据是一个样本，当实际上H0为真时，仍可能作出拒绝H0得决策（这种可能性是没法消除的），这是第一类错误，犯这类错误得几率记做：P{ 当H0为真时拒绝H0 }

因为没法排除犯这类错误的可能性，所以，须要把犯这类错误的几率控制在必定限度以内，即给出一个较小的数 α (一般的取值有5%，2.5%，和1%)，使犯这类错误的几率不超过α，即便得：

P{ 当H0为真时拒绝H0 } <= α

为了肯定常数k，考虑使用统计量Z，因为只容许犯这类错误的几率最大为 α ，获得以下等式：

因为当H0为真时，统计量Z~N(0,1)，由标准正态分布分位点的定义得 k=z_α/2

若是Z的观察值知足 |z|>=k=z_α/2，则拒绝H0；若是|z|<k=z_α/2，则接受H0。

step5，根据样本观测值作出决策

在本例中，α=0.05，则有k=z_α/2 =k=z_0.025=1.96，又已知n=9，σ=0.015，再由样本值计算得=0.511，

那么统计量Z的观测值是：

因而拒绝H0，认为这天包装机工做不正常。

参考文档：

假设检验

关于显著性检验，你想要的都在这儿了！！（基础篇）

显著性检验