假设检验的基本思想:python
若对整体的某个假设是真实的,那么不利于或者不能支持这一假设的事件A在一次试验中是几乎不可能发生的。若是事件A真的发生了,则有理由怀疑这一假设的真实性,从而拒绝该假设。dom
实质分析:spa
假设检验实质上是对原假设是否正确进行检验,所以检验过程当中要使原假设获得维护,使之不轻易被拒绝;否认原假设必须有充分的理由。同时,当原假设被接受时,也只能认为否认该假设的根据不充分,而不是认为它绝对正确。code
一、检验指定的数列是否服从正态分布orm
借助假设检验的思想,利用K-S检验能够对数列的性质进行检验,看代码:blog
from scipy.stats import kstest import numpy as np x = np.random.normal(0,1,1000) test_stat = kstest(x, 'norm')
首先生成1000个服从N(0,1)标准正态分布的随机数,在使用k-s检验该数据是否服从正态分布,提出假设:x从正态分布。事件
最终返回的结果,p-value=0.76584491300591395,比指定的显著水平(假设为5%)大,则咱们不能拒绝假设:x服从正态分布。ip
这并非说x服从正态分布必定是正确的,而是说没有充分的证据证实x不服从正态分布。所以咱们的假设被接受,认为x服从正态分布。ci
若是p-value小于咱们指定的显著性水平,则咱们能够确定的拒绝提出的假设,认为x确定不服从正态分布,这个拒绝是绝对正确的。class
二、检验指定的两个数列是否服从相同分布
from scipy.stats import ks_2samp beta=np.random.beta(7,5,1000) norm=np.random.normal(0,1,1000) ks_2samp(beta,norm)
咱们先分别使用beta分布和normal分布产生两个样本大小为1000的数列,使用ks_2samp检验两个数列是否来自同一个样本,提出假设:beta和norm服从相同的分布。
最终返回的结果,p-value=4.7405805465370525e-159,比指定的显著水平(假设为5%)小,则咱们彻底能够拒绝假设:beta和norm不服从同一分布。