Evernote Export
参数估计与假设检验是统计推断的两个组成部分,都是利用样本信息对整体进行推断,可是角度不一样。
参数估计是样本统计量估计整体参数的方法,整体参数在估计前是未知的。
假设检验是先对整体参数提出一个假设,后用样本信息去验证这个假设是否正确。
参数估计不知道整体的信息,也不进行假定,假设不知道整体,须要验证信息。spa
1.假设检验的基本思想和原理
2.假设检验的步骤
3.一个整体参数的检验
4.两个整体参数的检验
5.P值的计算与应用
6.用EXCEL进行检验orm
1.假设问题的提出
2.假设的表达式
3.两类错误
4.假设检验的流程
5.利用P值进行决策xml
什么是假设?
对整体参数的具体数值所作的陈述
-整体参数包括整体均值、比例、方差等
-分析以前必需陈述事件
什么是假设检验
1.先对整体的参数(或分布形式)提出某种假设,而后利用样本信息判断假设是否成立的过程
2.有参数检验和非参数检验
3.逻辑上运用反证法,统计上依据小几率原理ci
原假设
1.研究者想收集证据予以反对的假设
2.又称为"0假设"
3.老是有符号=,≤或≥
4.表示为H0
H0:\mu=某一数值
指定为符号=,≤或≥
例如 H0:μ=10cm
通常状况下,记原假设为H0所谓为零假设
备择假设
1.研究者想收集证据予以支持的假设
2.也称为研究假设
3.老是有符号 !=,≤或≥
4.表示为H1
H1:μ<某一数值,或μ>某一数值
例如:H1:μ<10cm,或mu>10cm
原假设和备择假设是属于非此即彼的关系,通常来讲,原假设是包含等于的
提出假设
1.原假设和备择假设是一个完备事件组,并且相互独立
在一项假设检验中,原假设和备择假设必有一个条件成立,并且只有一个成立
2.先肯定备择假设,再肯定原假设
3.等号=老是放在原假设上
4.因研究目的不一样,对同一问题可能提出不一样的假设(也可能得出不一样的结论)
双侧检验和单侧检验
1.备择假设没有特定的方向性,并含有符号≠的假设检验,称为双侧检验或双尾检验
2.备择假设具备特定的方向性,并含有符号≤和\req的假设检验,称为单侧检验或单尾检验it
- 备择假设的方向为<,称为左侧检验
- 备择假设的方向为>,称为右侧检验
假设 | 双侧检验 | 单侧检验(左侧) | 单侧检验(右侧) |
---|---|---|---|
原假设 | H0:μ=μ0 | H0:μ≥μ0 | H0:μ≤μ0 |
备择假设 | H1:μ≠μ0 | H1:μ<μ0 | H1:μ>μ0 |
- 1.第I类错误(弃真错误)
- 原假设为真,拒绝原假设
第I类错误的几率记为α,被称为显著性水平
2.第II类错误(取伪错误)- 原假设为假设时未拒绝原假设
- 第II类错误的几率记为β
两类错误时此消彼长的关系,不可能同时达到平衡,须要有所取舍
影响beta错误的因素io
- 1.整体参数的真值
- 随着假设的整体参数的减小而增大
2.显著性水平α
当α减小时增大
3.整体标准差
当α增大时增大
4.样本容量n
当n减小时增大
显著性水平α
1.是一个几率值
2.原假设为真时,拒绝原假设的几率被称为抽样分布的拒绝域
表示为αtable
- 经常使用的α有0.01,0.05,0.1
由研究者提出
假设检验中的小几率原理
什么是小几率?
1.在一次试验中,一个几乎不可能发生的事件发生的几率
2.在一次试验中小几率事件一旦发生,就有理由拒绝原假设
3.小几率由研究者事先肯定ast
检验统计量
1.根据样本观测结果计算获得的,并据以对原假设和备择假设做出决策的某个样本统计量
2.对样本估计量的标准化结果
- 原假设H0为真
- 点估计量的抽样分布
3.标准化的检验统计量
标准化检验统计量 ={点估计量-假设值}/{点估计量的抽样标准差}
决策规则
1.给定显著性水平区间下,查表的出相应的临界值z或z2α,tm或t2α
2.将检验统计量的值与显著性水平的临界值进行比较
3.作出决策
- 双侧检验 统计量>临界值,拒绝H0
- 左侧检验 统计量<- 临界值,拒绝H0
- 右侧检验 统计量>临界值,拒绝H0
什么是P值
1.在原假设为真的条件下,检验统计量的观察值大于或等于其计算值的几率
- 双侧检验为分布中两侧面积的总和
2.反映实际观测到的数据与原假设H0之间不一致的程度
3.被称为观察到的(或实测的)显著性水平
3.决策规则 若P值<α,拒绝原假设
1.假设检验的目的在于试图找到拒绝原假设,而不在于证实什么是正确的
2.拒绝原假设时结论是清楚的
- 例如 H0:μ=10,拒绝H0时,能够说μ≠10
3.当不拒绝原假设时,
- 并未给出明确的结论
- 不能说原假设是正确的,也不能说它不是正确的
- 例如,当不拒绝H0:μ=10,并未说它就是10,但也未说它不是10.只能说样本提供的证据不足以推翻原假设。
1.陈述原假设和备择假设
2.从研究的整体中抽出一个随机样本
3.肯定一个适当的检验统计量,并利用样本统计依据算出具体数值
4.肯定一个适当的显著性水平,并计算出其临界值,指定拒绝域
5.将统计量的值域临界值进行比较,作出决策
- 统计量的值落在拒绝域,拒绝H0,不然不拒绝H0
- 也能够直接利用P值作出决策
检验统计量的肯定
整体均值的检验
整体比例的检验
整体方差的检验
1.假定条件
正态整体或非正态整体大样本n ≥ 30
2.使用z检验统计量
α2 已知 z=nσx−μ0 N(0,1)
α2 未知 z=nsx−μ0 N(0,1)
假设 | 双侧检验 | 左侧检验 | 右侧检验 |
---|---|---|---|
假设形式 | H0:μ=μ0 | H0:μ≥μ0 | H0:μ≤μ0 |
假设形式 | H1:μ≠μ0 | H1:μ<μ0 | H1:μ>μ0 |
统计量 | α已知 | z=nσx−μ0 | |
统计量 | α未知 | z=nsx−μ0 | |
拒绝域 | z>z2α | z<−zα | z>zα |
P值决策 | P<α 拒绝H0 |
1.假定条件
- 整体服从正态分布
- 小样本(n<30)
2.检验统计量
α2已知 z=nσx−μ0~N(0,1)
α2未知 z=nsx−μ0~t(0,1)
假设 | 双侧检验 | 左侧检验 | 右侧检验 |
---|---|---|---|
假设形式 | H0:μ=μ0 | H0:μ≥μ0 | H0:μ≤μ0 |
假设形式 | H1:μ≠μ0 | H1:μ<μ0 | H1:μ>μ0 |
统计量 | α已知 | z=nσx−μ0 | |
统计量 | α未知 | z=nsx−μ0 | |
拒绝域 | t>t2α(n−1) | t<−tα(n−1) | t>tα(n−1) |
P值决策 | P<α 拒绝H0 |
假定条件
- 整体服从二项分布
- 可用正态分布来近似(大样本)
检验的z统计量
z=npi0(1−π0)p−π0
pi0为假设的整体比例
假设 | 双侧检验 | 左侧检验 | 右侧检验 |
---|---|---|---|
假设形式 | H0:μ=μ0 | H0:μ≥μ0 | H0:μ≤μ0 |
假设形式 | H1:μ≠μ0 | H1:μ<μ0 | H1:μ>μ0 |
统计量 | z=nπ0(1−π0)p−π0 | ||
统计量 | |||
拒绝域 | z>z2α | z<−aα | z>zα |
P值决策 | P<α 拒绝H0 |
整体方差是服从卡方分布的,检验一个整体的方差或标准差,假设整体近似服从正态分布,使用χ2
检验统计量
χ2=σ02(n−1)s2~χ2(n−1)
其中s为样本方差,σ为假设整体方差
两个统计量的肯定
两个整体均值之差的检验
两个整体比例之差的检验
两个整体方差之比的检验
检验中的匹配样本
1.假定条件
- 两个样本是独立的随机样本
- 正态整体或非正态整体大样本(n_1 \geq 30 n_2 \req 30)检验统计量
σ12,σ22已知z=n1σ12+n2σ22(x1−x2)−(μ1−μ2)~N(0,1)
σ12,σ22未知z=n1σ12+n2σ22(x1−x2)−(μ1−μ2)~N(0,1)
1.假定条件
- 两个独立的小样本
- 两个整体都是正态分布
σ12、σ22已知
检验统计量
z=n1σ12+n2σ22(x1−x2−(μ1−μ2))~N(0,1)
\sigma_1^2,\sigma_2^2未知可是\sigma_1^2=\sigma_2^2$$
1.假定条件
- 两个独立的小样本
- 两个整体都是正态分布
- σ12、σ22未知可是相等,即σ12=σ22
2.检验统计量
t=spn11+n21(x1−x2)−(μ1−μ2)
其中sp2=n1+n2−2(n1−1)s12+(n2−1)s22
σ12,σ22未知且不相等σ12≠σ22
假定条件
- 两个整体都是正态分布
- σ22,σ22未知且不相等,即σ12≠σ22
- 样本容量不相等,即n1≠n2
检验统计量
t=n1s12+n2s22(x1−x2)−(μ1−μ2)
自由度 v=n1−1n22s12+n2−1n2s22(n1s12+n2s22)
假定条件
两个整体配对差值构成的整体服从配对差是由差值整体中随机抽取的数据配对或匹配(重复测量(前/后))
检验统计量
t=ndSdd−d0~t(n−1)
样本差值均值d=nd∑i=1ndi
假定条件
两个整体都服从二项分布
能够用正态分布来近似检验统计量
检验H0,π1−π2=0,z=p(1−p)(n11+n21)p1−p2
检验H0,π1−π2=d0,z=n1p1(1−p1)+n2p2(1−p2)(p1−p2)−d0