假设检验背后的逻辑

时间 2019-11-09

标签假设检验背后逻辑繁體版

原文原文链接

内容转自知乎相关问题答案，写的很清晰。react

1. 概述逻辑：测试

全称命题只能被否证而不能被证实。这个道理很简单，个案固然不足以证实一个全称命题，可是却能够否认全称命题。spa

研究时，咱们固然不但愿否证本身的研究假设，因此咱们就搞个和研究假设相反的虚无假设。若是咱们否证了虚无假设，就至关于咱们证实了研究假设。因此假设检验就是要试图否证虚无假设，或者说拒绝虚无假设。这是第一层道理。3d

第二层道理和抽样分布有关。因为抽样的缘由，样本并不可能绝对地否证虚无假设。在个案中，小几率事件能够等同于不可能发生的事件。咱们在这个意义上去在必定的事先约定的几率水平上去拒绝虚无假设。blog

做者：慕容飞宇
连接：https://www.zhihu.com/question/20254932/answer/14502093
来源：知乎
著做权归做者全部。商业转载请联系做者得到受权，非商业转载请注明出处。

2. 具体解释：

做者：王小明
连接：https://www.zhihu.com/question/20254932/answer/45583793
来源：知乎
著做权归做者全部。商业转载请联系做者得到受权，非商业转载请注明出处。

我说我射击特别厉害，平均能打到8环，那么如何验证我是否是在吹牛逼呢，那就让我作几回射击看看我水平到底怎么样。

首先你选择相信我，假设我没吹牛，个人成绩在8环附近（这就是原假设）。
我做为一个8环水平的选手，射中的环数应该服从一个平均值为8的高斯分布。

可是事先说好个人原则：
一、可能我当天没吃饱饭呀、或者心情很差呀，并且也就只让我射击几回，我可能发挥很差等等的，因此你不能轻易怀疑我，若是我打7环、6环甚至4环你也不能怀疑我在吹牛；
二、可是毕竟做为一个8环水平的选手，基本功还应该是在的，若是我只打出了2环，你就会怀疑我是否是在吹牛了，请注意，做为一个8环水平的选手，打出2环但是几率极低的事情！

那么根据这个规则咱们设置一个阈值好比3.6环（这个阈值就是临界值），若是个人成绩为2环（个人成绩是观察值），那我就是在吹牛。注意做为一个8环选手，打出小于这个阈值的几率是极低的（这个几率就是显著性水平）。
还有一种判断我是否是在吹牛的方法是，我已经打完了，计算打出小于我这个成绩的几率（这个几率是p值），若是这个几率小于显著性水平，则说明个人成绩小于于临界值，则说明我在吹牛；反之则我没吹牛。（这个部分结合下面那个图来理解）

用统计的说法就是：
一、不轻易拒绝原假设。原假设即便真的成立，而观察的样本因为数量较少，观察值存在必定的波动。因此咱们要给原假设必定范围的容忍度，这个容忍度要尽量大，观察值出如今这个范围内都是能够容忍的。

二、小几率事件发生不正常。若是小几率事件仍是发生了，那么就说明原假设有问题。事件

结合这两点，咱们设置一个随机变量的区域，这个区域是偏离原假设的，而且发生在这个区域的几率很小，若是实际观察到的值仍是出如今这个不太可能出现的范围内，那么咱们能够拒绝原假设。ip

两种决定是否接受原假设的方法：io

一、给定发生偏离原假设极端状况的几率（这就是显著性水平alpha），能够计算获得对应的临界值(参照图1，偏离原假设的阴影部分面积表示显著性水平，对应的坐标表示临界值)。若观察值在临界值范围内，表示出现这种现象都是比较正常的，则可接受原假设；若观察值超出临界值范围，则表示在原假设条件下出现了不太可能的现象，那么咱们就怀疑原假设的成立性，则拒绝原假设。class

二、给定发生偏离原假设极端状况的几率。计算出现观察值及比观察值还要偏离原假设的几率（这就是p值）。（参照下面这个图来理解）若p>alpha，则表示观察值在临界值范围内，则可接受原假设（如图1）；若p<alpha，则表示观察值在临界值范围以外，则拒绝原假设（如图2）。p值是一我的工定义的东西，它其实仍是经过判断观察值是否在临界值范围内来决定是否接受原假设。变量

总结下：

对于一个假设，我不知道它是否成立，并且实际测试过程当中也存在许多非肯定性因素可能致使个人测试过程不许确，那么我给出一个出现错误的容忍度（也就是显著性水平alpha），根据这个容忍度能够获得相应临界值（若观察值在这个范围内都是正常的，不然不正常），而后将观察值和这个值比较。

可是有些状况下观察值不太好看出来，咱们能够计算出发生观察状况以及更坏状况的值（也就是p值）。若p值比alpha值大，则代表观察值在临界值范围内，可接受原假设（如图1）；若p值比alpha值小，则代表观察值在临界值范围外，则决绝原假设（如图2）。