通常而言,为了肯定从样本 (sample) 统计结果推论至整体时所犯错的几率,咱们会利用统计学家所开发的一些统计方法,进行统计检定。html
经过把所获得的统计检定值,与统计学家创建了一些随机变量的几率分布 (probability distribution) 进行比较,咱们能够知道在多少 % 的机会下会获得目前的结果。假若经比较后发现,出现这结果的机率不多,亦便是说,是在机会很 少、很罕有的状况下才出现;那咱们即可以有信心的说,这不是巧合,是具备统计学上的意义的 (用统计学的话讲,就是可以拒绝虚无假设 null hypothesis,Ho)。相反,若比较后发现,出现的机率很高,并不罕见;那咱们便不能颇有信心的直指这不是巧合,也许是巧合,也许不是,但咱们没 能肯定。spa
F 值和 t 值就是这些统计检定值,与它们相对应的几率分布,就是 F 分布和 t 分布。统计显著性(sig)就是出现目前样本这结果的机率。设计
结果的统计学意义,是结果然实程度(可以表明整体)的一种估计方法。专业上,p 值为结果可信程度的一个递减指标,p 值越大,咱们越不能认为样本中变量的关联是 整体中各变量关联的可靠指标。p 值是将观察结果认为有效即具备整体表明性的犯错几率。如 p=0.05 提示样本中变量关联有 5% 的多是因为偶然性形成的。 即假设整体中任意变量间均无关联,咱们重复相似实验,会发现约 20 个实验中有一个实验,咱们所研究的变量关联将等于或强于咱们的实验结果。(这并非说如 果变量间存在关联,咱们可获得 5% 或 95% 次数的相同结果,当整体中的变量存在关联,重复研究和发现关联的可能性与设计的统计学效力有关。)在许多研究领 域,0.05 的 p 值一般被认为是可接受错误的边界水平。htm
至於具体要检定的内容,须看你是在作哪个统计程序。对象
举一个例子,好比,你要检验两独立样本均数差别是否能推论至整体,而行的 t 检验。blog
两样本 (如某班男生和女生) 某变量 (如身高) 的均数并不相同,但这差异是否能推论至整体,表明整体的状况也是存在著差别呢? 会不会整体中男女生根本没有差异,只不过是你那麼巧抽到这 2 样本的数值不一样?开发
为此,咱们进行 t 检定,算出一个 t 检定值。get
与统计学家创建的以「整体中没差异」做基础的随机变量 t 分布进行比较,看看在多少% 的机会 (亦即显著性 sig 值) 下会获得目前的结果。it
若显著性 sig 值不多,好比 <0.05 (少於5% 机率),亦便是说,「若是」整体「真的」没有差异,那麼就只有在机会不多(5%)、很罕有的状况下, 才会出现目前这样本的状况。虽然仍是有5% 机会出错(1-0.05=5%),但咱们仍是能够「比较有信心」的说:目前样本中这状况(男女生出现差别的情 况)不是巧合,是具统计学意义的,「整体中男女生不存差别」的虚无假设应予拒绝,简言之,整体应该存在著差别。io
每一种统计方法的检定的内容都不相同,一样是t-检定,多是上述的检定整体中是否存在差别,也同能是检定整体中的单一值是否等於0或者等於某一个数值。
至於F-检定,方差分析(或译变异数分析,Analysis of Variance),它的原理大体也是上面说的,但它是透过检视变量的方差而进行的。它主要用于:均数差异的显著性检验、分离各有关因素并估计其对总变异 的做用、分析因素间的交互做用、方差齐性(Equality of Variances)检验等状况。
t 检验过程,是对两样本均数(mean)差异的显著性进行检验。唯 t 检验须知道两个整体的方差(Variances)是否相等;t 检验值的计算会因方差是否相等而有所不一样。也就是说,t 检验须视乎方差齐性(Equality of Variances)结果。因此,SPSS在进行t-test for Equality of Means的同时,也要作Levene”s Test for Equality of Variances 。
1.在Levene”s Test for Equality of Variances一栏中 F值为2.36, Sig. 为.128,表示方差齐性检验「没有显著差别」,即两方差齐(Equal Variances),故下面 t 检验的结果表中要看第一排的数据,亦即方差齐的状况下的t检验的结果。
2. 在t-test for Equality of Means中,第一排(Variances=Equal)的状况:t=8.892, df=84, 2-Tail Sig=.000, Mean Difference=22.99 既然Sig=.000,亦即,两样本均数差异有显著性意义!
3.到底看哪一个Levene”s Test for Equality of Variances一栏中sig, 仍是看t-test for Equality of Means中那个Sig. (2-tailed)啊?
答案是:两个都要看。
先看Levene”s Test for Equality of Variances,若是方差齐性检验「没有显著差别」,即两方差齐(Equal Variances),故接著的t检验的结果表中要看第一排的数据,亦即方差齐的状况下的t检验的结果。
反之,若是方差齐性检验「有显著差别」,即两方差不齐(Unequal Variances),故接著的t检验的结果表中要看第二排的数据,亦即方差不齐的状况下的t检验的结果。
4.你作的是T检验,为何会有F值呢?
就是由于要评估两个整体的方差(Variances)是否相等,要作Levene”s Test for Equality of Variances,要检验方差,故因此就有F值。
另外一种解释:
t检验有单样本t检验,配对t检验和两样本t检验。
单样本t检验:是用样本均数表明的未知整体均数和已知整体均数进行比较,来观察此组样本与整体的差别性。
配对t检验:是采用配对设计方法观察如下几种情形,1,两个同质受试对象分别接受两种不一样的处理;2, 同一受试对象接受两种不一样的处理;3,同一受试对象处理先后。
F检验又叫方差齐性检验。在两样本t检验中要用到F检验。
从两研究整体中随机抽取样本,要对这两个样本进行比较的时候,首先要判断两整体方差是否相同,即方差齐性。若两整体方差相等,则直接用t检验,若不等,可采用t”检验或变量变换或秩和检验等方法。
其中要判断两整体方差是否相等,就能够用F检验。
如果单组设计,必须给出一个标准值或整体均值,同时,提供一组定量的观测结果,应用t检验的前提条件就是该组资料必须服从正态分布;如果配对设计,每对数据 的差值必须服从正态分布;
如果成组设计,个体之间相互独立,两组资料均取自正态分布的整体,并知足方差齐性。之因此须要这些前提条件,是由于必须在这样的 前提下所计算出的t统计量才服从t分布,而t检验正是以t分布做为其理论依据的检验方法。
简单来讲就是实用T检验是有条件的,其中之一就是要符合方差齐次性,这点须要F检验来验证
统计学意义(p值)
结果的统计学意义是结果然实程度(可以表明整体)的一种估计方法。专业上,p值为结果可信程度的一个递减指标,p值越大,咱们越不能认为样本中变量的关联是 整体中各变量关联的可靠指标。p值是将观察结果认为有效即具备整体表明性的犯错几率。如p=0.05提示样本中变量关联有5% 的多是因为偶然性形成的。 即假设整体中任意变量间均无关联,咱们重复相似实验,会发现约20个实验中有一个实验,咱们所研究的变量关联将等于或强于咱们的实验结果。(这并非说如 果变量间存在关联,咱们可获得5% 或95% 次数的相同结果,当整体中的变量存在关联,重复研究和发现关联的可能性与设计的统计学效力有关。)在许多研究领 域,0.05的p值一般被认为是可接受错误的边界水平。
如何断定结果具备真实的显著性
在最后结论中判断什么 样的显著性水平具备统计学意义,不可避免地带有武断性。换句话说,认为结果无效而被拒绝接受的水平的选择具备武断性。实践中,最后的决定一般依赖于数据集 比较和分析过程当中结果是先验性仍是仅仅为均数之间的两两>比较,依赖于整体数据集里结论一致的支持性证据的数量,依赖于以往该研究领域的惯例。通 常,许多的科学领域中产生p值的结果≤0.05被认为是统计学意义的边界线,可是这显著性水平还包含了至关高的犯错可能性。结果 0.05≥p>0.01 被认为是具备统计学意义,而 0.01≥p≥0.001 被认为具备高度统计学意义。但要注意这种分类仅仅是研究基础上非正规的 判断常规。
全部的检验统计都是正态分布的吗?
并不彻底如此,但大多数检验都直接或间接与之有关,可 以从正态分布中推导出来,如 t检验、f 检验或卡方检验。这些检验通常都要求:所分析变量在整体中呈正态分布,即知足所谓的正态假设。许多观察变量的确是呈 正态分布的,这也是正态分布是现实世界的基本特征的缘由。当人们用在正态分布基础上创建的检验分析非正态分布变量的数据时问题就产生了,(参阅非参数和方 差分析的正态性检验)。
这种条件下有两种方法:一是用替代的非参数检验(即无分布性检验),但这种方法不方便,由于从它所提供的结论形式看,这种方法统计 效率低下、不灵活。另外一种方法是:当肯定样本量足够大的状况下,一般仍是可使用基于正态分布前提下的检验。后一种方法是基于一个至关重要的原则产生的, 该原则对正态方程基础上的整体检验有极其重要的做用。即,随着样本量的增长,样本分布形状趋于正态,即便所研究的变量分布并不呈正态。