作完一个假设检验以后,若是结果具备统计显著性,那么还须要继续计算其效应量,若是结果不具备统计显著性,而且还须要继续进行决策的话,那么须要计算功效。css
功效(power):正确拒绝原假设的几率,记做1-β。html
假设检验的功效受如下三个因素影响:ide
- 样本量 (n):其余条件保持不变,样本量越大,功效就越大。
- 显著性水平 (α): 其余条件保持不变,显著性水平越低,功效就越小。
- 两整体之间的差别:其余条件保持不变,整体参数的真实值和估计值之间的差别越大,功效就越大。也能够说,效应量(effect size)越大,功效就越大。
应用:根据显著性水平α,效应量和样本容量n,计算功效。post
(可用G*Power或Statsmodels计算)spa
单样本t检验:statsmodels.stats.power.
tt_solve_power
(effect_size=None, nobs=None, alpha=None, power=None, alternative='two-sided')3d
独立样本t检验:statsmodels.stats.power.
tt_ind_solve_power
(effect_size=None, nobs1=None, alpha=None, power=None, ratio=1.0, alternative='two-sided')code
卡方检验:statsmodels.stats.power.GofChisquarePower.
solve_power
(effect_size=None, nobs=None, alpha=None, power=None, n_bins=2)htm
F检验:statsmodels.stats.power.FTestPower.
solve_power
(effect_size=None, df_num=None, df_denom=None, nobs=None, alpha=None, power=None, ncc=1)blog
方差分析:statsmodels.stats.power.FTestAnovaPower.
solve_power
(effect_size=None, nobs=None, alpha=None, power=None, k_groups=2)ci
效应量(effect size): 样本间差别或相关程度的量化指标。
效应量一般用三种方式来衡量:(1) 标准均差(standardized mean difference),(2) 概率(odd ratio),(3) 相关系数(correlation coefficient)。
这里说一下第一种:标准均差(standardized mean difference)。主要有如下几种指标:
Cohen’s d : 两整体均值之间的标准差别。适用于两组样本的样本量和方差类似的状况。
计算公式:
其中:
Hedges’ g: 是cohen的方法的改进,适用于两组样本的样本量不一样的状况。
计算公式:
其中:
Glass’s Δ (delta): 和cohen的方法相似,可是只除以控制组的标准差。适用于两组样本的方差不一样的状况。
计算公式:
Cramer’s φ (Phi) or Cramer’s V: 用于测算类别型数据的效应量。当类别型变量包含2个类别时,使用Cramer’s phi,若是超过2个类别,那么使用Cramer’s V。
Cohen’s f2: 用于测算方差分析,多元回归之类的效应量。
计算公式:
应用:根据显著性水平α,功效和样本容量n,计算效应量。
(可用G*Power或Statsmodels计算)
单样本t检验:statsmodels.stats.power.
tt_solve_power
(effect_size=None, nobs=None, alpha=None, power=None, alternative='two-sided')
独立样本t检验:statsmodels.stats.power.
tt_ind_solve_power
(effect_size=None, nobs1=None, alpha=None, power=None, ratio=1.0, alternative='two-sided')
卡方检验:statsmodels.stats.power.GofChisquarePower.
solve_power
(effect_size=None, nobs=None, alpha=None, power=None, n_bins=2)
F方差齐性检验:statsmodels.stats.power.FTestPower.
solve_power
(effect_size=None, df_num=None, df_denom=None, nobs=None, alpha=None, power=None, ncc=1)
方差分析:statsmodels.stats.power.FTestAnovaPower.
solve_power
(effect_size=None, nobs=None, alpha=None, power=None, k_groups=2)
以上两种应用都属于过后检验(post hoc)。除此以外,还有一个应用就是:根据显著性水平α,功效和效应量,计算样本容量n。这属于事前检验(prior)。具体请见:《如何肯定假设检验的样本量?》。
参考:
https://wenku.baidu.com/view/d78a82ecb9d528ea80c7792c.html
https://www.statisticssolutions.com/statistical-analyses-effect-size/