几率统计23——假设检验理论(2)

假设检验其实是用反证法作出非对即错的判断:先假定原假设是对的,而后将抽样数据代入相应的分布中去验证,观察原假设的数值是落在接受域仍是拒绝域,由此作出是接受仍是拒绝原假设的判断。微信

值得注意的是,不一样于以往严格的数学证实,假设检验是创建在小几率事件原理的基础之上。因为小几率事件也有可能发生,所以并不能百分之百肯定原假设必定不成立,也就是说,原假设也有判断错误的时候。学习

两种错误类型

假设检验有两种判断错误的类型,统计学家给出了专业的名称:第一类错误和第二类错误。spa

第一类错误(false reject):错误地拒绝,H0是对的,却拒绝了它。也就是说,计算结果落在拒绝域,但真实结果是在接受域。blog

第二类错误(false accept):错误地接受,H0是错的,却接受了它。也就是说,计算结果落在接受域,但真实结果是在拒绝域。事件

第一类错误也叫Ⅰ 型错误或弃真错误,第二类错误也叫Ⅱ 型错误或存伪错误。我以为仍是忘记这些文绉绉名称,记住false reject和false accept便可,毕竟这两个英文短语更直白,更容易理解。数学

 

假设检验的理想状况是能过作出与实际相符的正确断言,但因为抽样数据的随机性,根据样本计算的统计量必然会与总体的真实数值存在差别,这种差别可能致使出现四种判断结果:产品

错误的几率

既然假设检验没法保证百分之百有效,那么咱们就须要研究两类错误出现的几率,由此将假设检验的功效数值化。基础

 

先来看第一类错误。原理

第一类错误是在H0正确的时候错误地却拒绝了它,这就意味着咱们的判断结果落在了拒绝域内:二维码

 

 结果落在拒绝域内的几率与显著性水平一致,所以α的数值决定了出现第一类错误几率:

 

随着α的减少,第一类错误出现的几率也随之减少。当α=0时,第一类错误彻底消失,也就是永远不会拒绝H0,这有点像过去的“守旧派”对于“法先王”的绝对拥护,不管时代怎么进步,“法先王”都必须服从,任何改革都视为大逆不道。

能够看出,因为α的值很小,因此犯第一类错误的概率也很小。

 

再来看第二类错误。

第二类错误是在H0错误的时候接受了它,一个本应落在拒绝域内的点却落在了接受域内:

 

 咱们用β表示第二类错误出现的几率,只要α肯定了,β也就肯定了。一个草率的判断是β=1-α,按照这种计算方式,β=0.95,这意味着第二类错误出现的几率高达95%!若是这样,那么假设检验还有什么用?

实际上β的计算比α可贵多。

   

咱们延用产品元件的故事。μ0是改善前整体的均值,μ1是改善后整体的均值,改善先后的标准差一致,都是σ=6。

原假设H0:改善前与改善后是同一个正态分布,μ01=600。

备择假设H1:改善前与改善后是不一样的正态分布,μ0 =600< μ1=603。

公司用新技术制造了大量元件,从中屡次抽取容量是m(m≥30)的样本进行检验。根据中心极限定理,样本均值的分布服从均值为整体均值,方差为整体方差1/m的正态分布:

对样本均值进行标准化处理:

使用0.05显著性水平,在标准正态分布下,查表可知临界值是1.645。

当Z0 > 1.645时,将拒绝H0假设。

再来看均值的逆运算:

也就是说,若是抽样的均值大于601.802,就应该拒绝相信H0

如今能够计算出标准正态分布下β区域的临界值:

 

 

结论是,若是改善后的功率均值是603,那么以此为条件,犯第二类错误的几率是β=0.137。经过β的计算过程能够看出,只有当H1假设是一个固定的值时,才能计算出β。若是H1假设不是固定,好比只给出了μ1 > 603,那么将没法根据①计算出z1,也就没法进一步求得β

 

一个常见的问题是,既然一开始就知道了H0和H1的均值和方差,为何还要使用标准化处理?直接计算临界值岂不是更简单?

咱们的确能够直接经过计算机解求得X~(μ0, σ2)时的临界值,但这是整体分布下的临界值,而咱们的假设检验是基于抽样,并不是整体,此时用到的理论是中心极限定理,所以才大费周章地使用标准化形态。

 


   出处:微信公众号 "我是8位的"

  本文以学习、研究和分享为主,如需转载,请联系本人,标明做者和出处,非商业用途! 

   扫描二维码关注做者公众号“我是8位的”

 

相关文章
相关标签/搜索