假设检验

1.假设检验的基本思想html

假设检验:测试

  • 什么是假设:对整体参数(均值,比例等)的具体数值所做的陈述。好比,我认为新的配方的药效要比原来的更好。
  • 什么是假设检验:先对整体的参数提出某种假设,而后利用样本的信息判断假设是否成立的过程。好比,上面的假设我是要接受仍是拒绝呢。


假设检验的应用:spa

  • 推广新的教育方案后,教学效果是否有所提升
  • 醉驾断定为刑事犯罪后是否会使得交通事故减小
  • 男生和女生在选文理科时是否存在性别因素影响

 

假设检验的基本思想:设计

 

显著性水平:3d

  • 一个几率值,原假设为真时,拒绝原假设的几率,表示为alpha,经常使用取值为0.01,0.05,0.10
  • 一个公司要来招聘了,原本实际有200我的准备混一混,可是公司但愿只有5%的人是浑水摸鱼进来的,因此可能会有200*0.05=4我的混进来,所谓显著性水平α,就是你容许最多有多大比例浑水摸鱼的经过你的测试。

 

假设检验的步骤:htm

  • 提出假设
  • 肯定适当的检验统计量
  • 规定显著性水平
  • 计算检验统计量的值
  • 作出统计决策

 

2.左右检验与双侧检验对象

原假设与备择建设:blog

  • 待检验的假设又叫原假设,也能够叫零假设,表示为H0。(零假设其实就是表示原假设通常都是说没有差别,没有改变。。。)
  • 与原假设对比的假设叫作备择假设,表示为H1
  • 通常在比较的时候,主要有等于,大于,小于

 

检验统计量:事件

  • 计算检验的统计量
  • 根据给定的显著性水平,查表得出相应的临界值
  • 将检验统计量的值与显著性水平的临界值进行比较
  • 得出拒绝或不拒绝原假设的结论


检验中常说的小几率:ci

  • 在一次试验中,一个几乎不可能发生的事件发生的几率
  • 在一次试验中小几率事件一旦发生,咱们就有理由拒绝原假设
  • 小几率由咱们事先肯定

 

检验中常说的小几率:

  • 在一次试验中,一个几乎不可能发生的事件发生的几率
  • 在一次试验中小几率事件一旦发生,咱们就有理由拒绝原假设
  • 小几率由咱们事先肯定

 

P值:

  • 是一个几率值
  • 若是原假设为真,P-值是抽样分布中大于或小于样本统计量的几率
  • 左侧检验时,P-值为曲线下方小于等于检验统计量部分的面积
  • 右侧检验时,P-值为曲线下方大于等于检验统计量部分的面积


左侧检验与右侧检验

  • 当关键词有不得少于/低于的时候用左侧,好比灯泡的使用寿命不得少于/低于700小时时
  • 当关键词有不得多于/高于的时候用右侧,好比次品率不得多于/高于5%时

 

  • 当左侧检验时,样本统计量小于临界值(位于临界值左边,临界值的大小由查表得出),则拒绝原假设,不然接受原假设
  • 当右侧检验时,样本统计量大于临界值(位于临界值右边,临界值的大小由查表得出),则拒绝原假设,不然接受原假设

 

双侧检验

  • 单侧检验指按分布的一侧计算显著性水平几率的检验。用于检验大于、小于、高于、低于、优于、劣于等有肯定性大小关系的假设检验问题。这类问题的肯定是有必定的理论依据的。假设检验写做:u1<u2或u1>u2。
  • 双侧检验指按分布两端计算显著性水平几率的检验,应用于理论上不能肯定两个整体一个必定比另外一个大或小的假设检验。通常假设检验写做H1:u1≠u2。

例如,某种零件的尺寸,要求其平均长度为10cm,大于或小于10cm均属于不合格,咱们想要证实(检验)大于或小于这两种可能性中的任何一种是否成立,创建的原假设与备择假设应为:
  H0:u=10    H1:u≠10

 

检验结果:

  单侧检验

  • 若p值>a,不拒绝H0
  • 若p值<a,拒绝H0

  双侧检验:

  • 若p值>a/2,不拒绝H0
  • 若p值<a/2,拒绝H0

 

3.Z检验基本原理

整体均值检验

  • 注意:通常状况下都用t检验,能用z检验的均可以用t检验,能用t检验的不必定能用z检验。

 

统计量Z值的计算公式为:
若是检验一个样本平均数与一个己知的整体平均数的差别是否显著,其z值计算公式为:

若是检验来自两个的两组样本平均数的差别性,从而判断它们各自表明的整体的差别是否显著,其Z值计算公式为:

Z检验原理:

  • 当整体标准差已知,样本量较大时用标准正态分布的理论来推断差别发生的几率,从而比较两个平均数的差别是否显著
  • 标准正态变换后Z的界值

双侧:

单侧:

 

4.Z检验实例

Z检验实例1:
研究正常人与高血压患者胆固醇含量(mg%)的资料以下,试比较两组血清胆固醇含量有无差异。

正常人组:

高血压组:

创建检验假设,肯定检验水平

计算统计量Z值
  >将已知数据代入公式,得

肯定P值,做出推断结论:本例Z=10.40>1.96(本例符合双侧检验,查表得1 - α/2 = 0.975对应值),故P<0.05,按α=0.05水准拒绝H0,接受H1,能够认为正常人与高血压患者的血清胆固醇含量有差异,高血压患者高于正常人。

 

Z检验实例2:
某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其整体均值为u=0.081mm,整体标准差为δ=0.025。今换一种新机床进行加工,抽取n=200个零件进行检验,获得的椭圆度为0.076mm。试问新机床加工零件的椭圆度的均值与之前有无显著差别?(α=0.05)  本例符合双侧检验。

 

Z检验实例3:
根据过去大量资料,某厂生产的灯泡的使用寿命服从正态分布N~(1020,100/2)。现从最近生产的一批产品中随机抽取16只,测得样本平均寿命为1080小时。试在0.05的显著性水平下判断这批产品的使用寿命是否有显著提升?(α=0.05)

 

5.T检验基本原理

 

T检验:
根据研究设计,t检验有三种形式:

  • 单个样本的t检验:

  用来比较一组数据的平均值和一个数值有无差别。例如,你选取了5我的,测定了他们的身高,要看这五我的的身高平均值是否高于、低于仍是等于1.70m,就须要用这个检验方法。

  • 配对样本均数t检验(非独立两样本均数检验)

  用来看一组样本在处理先后的平均值有无差别。好比,你选取了5我的,分别在饭前和饭后测量了他们的体重,想检测吃饭对他们的体重有无影响,就须要用这个t检验。

  • 两个独立样本均数检验

  用来看两组数据的平均值有无差别。好比,你选取了5男5女,想看男女之间身高有无差别,这样,男的一组,女的一组,这两个组之间的身高平均值的大小比较可用这种方法。

 

单个样本t检验

  • 又称单样本均数t检验(one sample ttest),适用于样本均数与已知整体均数u0的比较,目的是检验样本均数所表明的整体均数是否与已知整体均数u0有差异。
  • 已知整体均数u0通常为标准值、理论值或经大量观察获得的较稳定的指标值。
  • 应用条件,整体标准α未知的小样本资料,且服从正态分布。

 

实例:

  以往经过大规模调查已知某地新生儿出生体重为3.30kg。从该地难产儿中随机抽取35名新生儿,平均出生体重为3.42kg,标准差为0.40kg,问该地难产儿出生体重是否与通常新生儿体重不一样?(临界值表:http://www.docin.com/p-1173562569.html)

 

  • 创建检验假设,肯定检验水准
  • 计算检验统计量

本例自由度v=n-1=35-1=34,查表得得t0.05/2, 34=2.032。由于t<t0.05/2,34,故P>0.05,按α=0.05水准,不拒绝H0,差异无统计学意义,尚不能认为该地难产儿与通常新生儿平均出生体重不一样。

 

 

配对样本均数t检验:

  • 简称配对t检验(paired ttest),又称非独立样本均数检验,适用于配对设计计量资料均数的比较。
  • 配对设计(paired design)是将受试对象按某些特征相近的原则配成对子,每对中的两个个体随机地给予两种处理。

 

配对样本均数t检验原理:

  • 配对设计的资料具备对子内数据一一对应的特征,研究者应关心是对子的效应差值而不是各自的效应值。
  • 进行配对t检验时,首选应计算各对数据间的差值d,将d做为变量计算均数。
  • 配对样本t检验的基本原理是假设两种处理的效应相同,理论上差值d的整体均数ud为0,现有的不等于0差值样本均数能够来自ud=0的整体,也能够来自u≠ 0的整体。
  • 可将该检验理解为差值样本均数与已知整体均数ud(ud=0)比较的单样本t检验,其检验统计量为:

 

实例:

有12名接种卡介苗的儿童,8周后用两批不一样的结核菌素,一批是标准结核菌素,一批是新制结核菌素,分别注射在儿童的前臂,两种结核菌素的皮肤浸润反应平均直径(mm)如表所示,问两种结核菌素的反应性有无差异。

 

 

6.T检验实例

7.T检验应用条件

8.卡方检验

 

9.假设检验中的两类错误
10.Python假设检验实例
11.Python卡方检验实例

相关文章
相关标签/搜索