T test 由来已久
from scipy import stats
import numpy as np
- 假设检验也叫显著性检验,是以小几率反证法的逻辑推理,判断假设是否成立的统计方法。
- 首先,假设样本对应的整体参数(或分布)与某个一直整体参数(或分布)相同,而后根据统计量的分布规律来分析样本数据,利用样本信息判断是否支持这种假设,并对检验假设作出抉择,作出的结论是几率性的,不是绝对的确定或者否认
- 简书原文连接
T 检验的概念
假设检验的步骤
假设检验能够分为三步:
- 创建建设检验的假设和肯定检验水准
- 选定检验防范和计算检验统计量
- 肯定P值和作出推断结论
创建检验假设和肯定检验水准
假设检验 是针对整体特征而言的,包括相互对立的两个方面,即两种假设,一周用是无效假设或者原假设、零假设,符号为H0,它是要否认的假设,另外一种是备选假设,记为H1,它是H0 的对立面。两者是从反正法的思想提出的,H1和H0的相互关系,又相互对立的假设
假设检验还须要根据研究目的的事件设置是否拒绝原假设的标准即,检验水准也叫显著性水准。它指的是原假设为真,可是被错误的拒绝的一个小几率值,通常去检验水准为α=0.05设计
单侧检验与双侧检验
在进行t检验的时候,若是其目的在于检验这个整体均数是否相等,即为双侧检验
例如,在检验某种新的降压药与经常使用降压药的效力是否相同,就是说,新药效力可能比旧药好,也可能比旧药查,或者相同,都有可能,此时则须要进行双侧检验code
若是咱们已经新药的效力不可能低于旧药的效力,例如磺胺药+磺胺药增效剂从理论上推知其效果不可能低于单用磺胺药,这时,原假设设定为H0: μ1=μ2,备选假设为H1:μ1>μ2 ,统计上成为单侧检验blog
选定检验方法和计算检验统计量
根据研究设计的类型和统计推断的目的选用不一样的检验方法,如成组设计的两样本均数的比较用t 检验,多个样本均数的比较用F检验事件
检验统计量适用于抉择是否拒绝H0 的统计量,所以在咱们肯定检验假设H0,H1时,检验方法的和检验统计量就已经肯定了,其统计分布在统计推断中相当重要,不一样的检验方法要用不一样的方式计算现有样本的检验统计量ip
肯定P值和作出推断结论
- 这里的P值是指由H0成立时的检验统计量出如今用本计算出来的统计量的末端或者更末端处的几率值
- 当P<=α时,结论按照索取检验水准H0,即认为二者的均值有显著性差别,而H0设定为二者相等,推翻H0,接受H1。(按照P值的定义,在H0成立的条件下,出现等于及大于现有检验统计量值的几率)The P-value is the probability of obtaining a result at least as extreme as the one that was actually observed, given that the null hypothesis is true.若是是检验问题,p值反映的是样本数据支持原假设的证据,p值越大,证据越强。若是P<α,则认为样本数据不能支持原假设,进而接受H1,即两个均值存在显著性差别,不相等
- 若是P>α,样本数据更支持H0,对于H0发生的几率也就越大,从而两个均值没有显著性差别,接受H0。
假设检验的两类错误
- I型错误,第一类错误,假阳性错误,就是在作假设检验作推断结论时,拒绝了实际上正确的原假设H0,其几率用α表示(拒绝正确),推断正确的可能性为1-α,也就是置信度
- II型错误,第二类错误,假阴性错误,原假设为不正确的,可是获得的统计量不足以拒接H0,错误的得出的无差异的结论(接受错误)
