样本几率统计

1.ztest-已知,单个正态整体的均值μ的假设检验(U检验法)

格式:函数

h = ztest(x,m,sigma)% x为正态整体的样本,m为均值μ0,sigma为标准差,显著性水平为0.05(默认值)测试

h = ztest(x,m,sigma,alpha) %显著性水平为alphaorm

[h,sig,ci,zval] = ztest(x,m,sigma,alpha,tail) %sig为观察值的几率,当sig为小几率时则对原假设提出质疑,ci为真正均值μ的1-alpha置信区间,zval为统计量的值.ci

说明 :test

若h=0,表示在显著性水平alpha下,不能拒绝原假设;变量

若h=1,表示在显著性水平alpha下,能够拒绝原假设.随机数

原假设:方法

tail=0,表示备择假设:(默认,双边检验);统计

tail=1,表示备择假设:(单边检验);数据

tail=-1,表示备择假设:(单边检验).

例4-74 某车间用一台包装机包装葡萄糖,包得的袋装糖重是一个随机变量,它服从正态分布.当机器正常时,其均值为0.5公斤,标准差为0.015.某日开工后检验包装机是否正常,随机地抽取所包装的糖9袋,称得净重为(公斤)

0.497, 0.506, 0.518, 0.524, 0.498, 0.511, 0.52, 0.515, 0.512

问机器是否正常

解:整体μ和σ已知,该问题是当为已知时,在水平下,根据样本值判断μ=0.5仍是.为此提出假设:

原假设:

备择假设:

>> X=[0.497,0.506,0.518,0.524,0.498,0.511,0.52,0.515,0.512];

>> [h,sig,ci,zval]=ztest(X,0.5,0.015,0.05,0)

结果显示为

h =1

sig =0.0248 %样本观察值的几率

ci =0.5014 0.5210 %置信区间,均值0.5在此区间以外

zval =2.2444 %统计量的值

结果代表:h=1,说明在水平下,可拒绝原假设,即认为包装机工做不正常.

2.ttest-未知,单个正态整体的均值μ的假设检验( t检验法)

格式

h = ttest(x,m) % x为正态整体的样本,m为均值μ0,显著性水平为0.05

h = ttest(x,m,alpha) %alpha为给定显著性水平

[h,sig,ci] = ttest(x,m,alpha,tail) %sig为观察值的几率,当sig为小几率时则对原假设提出质疑,ci为真正均值μ的1-alpha置信区间.

说明:

若h=0,表示在显著性水平alpha下,不能拒绝原假设;

若h=1,表示在显著性水平alpha下,能够拒绝原假设.

原假设:,

tail=0,表示备择假设:(默认,双边检验);

tail=1,表示备择假设:(单边检验);

tail=-1,表示备择假设:(单边检验).

例4-75 某种电子元件的寿命X(以小时计)服从正态分布,,σ2均未知.现测得16只元件的寿命以下

159 280 101 212 224 379 179 264 222 362 168 250

149 260 485 170

问是否有理由认为元件的平均寿命大于225(小时)

解:未知,在水平下检验假设

>> X=[159 280 101 212 224 379 179 264 222 362 168 250 149 260 485 170];

>> [h,sig,ci]=ttest(X,225,0.05,1)

结果显示为:

h =0

sig =0.2570

ci =198.2321 Inf %均值225在该置信区间内

结果代表:H=0表示在水平下应该接受原假设,即认为元件的平均寿命不大于225小时.

3.ttest2-两个正态整体均值差的检验(t检验),

两个正态整体方差未知但等方差时,比较两正态整体样本均值的假设检验

格式

[h,sig,ci]=ttest2(X,Y) %X,Y为两个正态整体的样本,显著性水平为0.05

[h,sig,ci]=ttest2(X,Y,alpha) %alpha为显著性水平

[h,sig,ci]=ttest2(X,Y,alpha,tail) %sig为当原假设为真时获得观察值的几率,当sig为小几率时则对原假设提出质疑,ci为真正均值μ的1-alpha置信区间.

说明

若h=0,表示在显著性水平alpha下,不能拒绝原假设;

若h=1,表示在显著性水平alpha下,能够拒绝原假设.

原假设:, (为X为指望值,为Y的指望值)

若 tail=0,表示备择假设:(默认,双边检验);

tail=1,表示备择假设:(单边检验);

tail=-1,表示备择假设:(单边检验).

例4-76 在平炉上进行一项试验以肯定改变操做方法的建议是否会增长钢的产率,试验是在同一只平炉上进行的.每炼一炉钢时除操做方法外,其余条件都尽量作到相同.先用标准方法炼一炉,而后用建议的新方法炼一炉,之后交替进行,各炼10炉,其产率分别为

(1)标准方法:78.1 72.4 76.2 74.3 77.4 78.4 76.0 75.5 76.7 77.3

(2)新方法: 79.1 81.0 77.3 79.1 80.0 79.1 79.1 77.3 80.2 82.1

设这两个样本相互独立,且分别来自正态整体和,,,均未知.问建议的新操做方法可否提升产率 (取α=0.05)

解:两个整体方差不变时,在水平下检验假设::,:

>> X=[78.1 72.4 76.2 74.3 77.4 78.4 76.0 75.5 76.7 77.3];

>>Y=[79.1 81.0 77.3 79.1 80.0 79.1 79.1 77.3 80.2 82.1];

>> [h,sig,ci]=ttest2(X,Y,0.05,-1)

结果显示为:

h =1

sig =2.1759e-004 %说明两个整体均值相等的几率很小

ci =-Inf -1.9083

结果代表:H=1表示在水平下,应该拒绝原假设,即认为建议的新操做方法提升了产率,所以,比原方法好.

4.ranksum-两个整体一致性的检验——秩和检验

格式

p = ranksum(x,y,alpha) %x,y为两个整体的样本,能够不等长,alpha为显著性水平

[p,h] = ranksum(x,y,alpha) % h为检验结果,h=0表示X与Y的整体差异不显著h=1表示X与Y的整体差异显著

[p,h,stats] = ranksum(x,y,alpha) %stats中包括:ranksum为秩和统计量的值以及zval为过去计算p的正态统计量的值

说明

P为两个整体样本X和Y为一致的显著性几率,若P接近于0,则不一致较明显.

例4-77 某商店为了肯定向公司A或公司B购买某种商品,将A和B公司以往的各次进货的次品率进行比较,数据以下所示,设两样本独立.问两公司的商品的质量有无显著差别.设两公司的商品的次品的密度最多只差一个平移,取α=0.05.

A:7.0 3.5 9.6 8.1 6.2 5.1 10.4 4.0 2.0 10.5

B:5.7 3.2 4.1 11.0 9.7 6.9 3.6 4.8 5.6 8.4 10.1 5.5 12.3

解:设,分别为A,B两个公司的商品次品率整体的均值.则该问题为在水平α=0.05下检验假设::,:

>> A=[7.0 3.5 9.6 8.1 6.2 5.1 10.4 4.0 2.0 10.5];

>> B=[5.7 3.2 4.1 11.0 9.7 6.9 3.6 4.8 5.6 8.4 10.1 5.5 12.3];

>> [p,h,stats]=ranksum(A,B,0.05)

结果为:

p =0.8041

h =0

stats =zval: -0.2481

ranksum: 116

结果代表:一方面,两样本整体均值相等的几率为0.8041,不接近于0;另外一方面,H=0也说明能够接受原假设,即认为两个公司的商品的质量无明显差别.

5.signrank-两个整体中位数相等的假设检验——符号秩检验

格式

p = signrank(X,Y,alpha) % X,Y为两个整体的样本,长度必须相同,alpha为显著性水平,P两个样本X和Y的中位数相等的几率,p接近于0则可对原假设质疑.

[p,h] = signrank(X,Y,alpha) % h为检验结果:h=0表示X与Y的中位数之差不显著,h=1表示X与Y的中位数之差显著.

[p,h,stats] = signrank(x,y,alpha) % stats中包括:signrank为符号秩统计量的值以及zval为过去计算p的正态统计量的值.

例4-78 两个正态随机样本的中位数相等的假设检验

>> x=normrnd(0,1,20,1);

>> y=normrnd(0,2,20,1);

>> [p,h,stats]=signrank(x,y,0.05)

p =0.3703

h =0

stats =zval: -0.8960

signedrank: 81

结果代表:h=0表示X与Y的中位数之差不显著

6.signtest-两个整体中位数相等的假设检验——符号检验

格式

p=signtest(X, Y, alpha) % X,Y为两个整体的样本,长度必须相同,alpha为显著性水平,P两个样本X和Y的中位数相等的几率,p接近于0则可对原假设质疑.

[p, h]=signtest(X, Y, alpha) % h为检验结果:h=0表示X与Y的中位数之差不显著,h=1表示X与Y的中位数之差显著.

[p,h,stats] = signtest(X,Y,alpha) % stats中sign为符号统计量的值

例4-79 两个正态随机样本的中位数相等的假设检验

>> X=normrnd(0,1,20,1);

>> Y=normrnd(0,2,20,1);

>> [p,h,stats]=signtest(X,Y,0.05)

p =0.2632

h =0

stats =sign: 7

结果代表:h=0表示X与Y的中位数之差不显著

7.jbtest-正态分布的拟合优度测试

格式

H = jbtest(X) %对输入向量X进行Jarque-Bera测试,显著性水平为0.05.

H = jbtest(X,alpha) %在水平alpha而非5%下施行 Jarque-Bera 测试,alpha在0和1之间.

[H,P,JBSTAT,CV] = jbtest(X,alpha) %P为接受假设的几率值,P越接近于0,则能够拒绝是正态分布的原假设;JBSTAT为测试统计量的值,CV为是否拒绝原假设的临界值.

说明

H为测试结果,若H=0,则能够认为X是服从正态分布的;若X=1,则能够否认X服从正态分布.X为大样本,对于小样本用lillietest函数.

例4-80 调用MATLAB中关于汽车重量的数据,测试该数据是否服从正态分布

>> load carsmall

>> [h,p,j,cv]=jbtest(Weight)

h =1

p =0.0267

j =7.2448

cv =5.9915

说明 p=2.67%表示应该拒绝服从正态分布的假设;h=1也能否定服从正态分布;统计量的值j = 7.2448大于接受假设的临界值cv =5.9915,于是拒绝假设(测试水平为5%).

8.lillietest-正态分布的拟合优度测试

格式

H = lillietest(X) %对输入向量X进行Lilliefors测试,显著性水平为0.05.

H = lillietest(X,alpha) %在水平alpha而非5%下施行Lilliefors测试,alpha在0.01和0.2之间.

[H,P,LSTAT,CV] = lillietest(X,alpha) %P为接受假设的几率值,P越接近于0,则能够拒绝是正态分布的原假设;LSTAT为测试统计量的值,CV为是否拒绝原假设的临界值.

说明

H为测试结果,若H=0,则能够认为X是服从正态分布的;若X=1,则能够否认X服从正态分布.

例4-81

>> Y=chi2rnd(10,100,1);

>> [h,p,l,cv]=lillietest(Y)

h =1

p =0.0175

l =0.1062

cv =0.0886

说明 h=1表示拒绝正态分布的假设;p = 0.0175表示服从正态分布的几率很小;统计量的值l = 0.1062大于接受假设的临界值cv =0.0886,于是拒绝假设(测试水平为5%).

>>hist(Y)

从图中看出,数据Y不服从正态分布.

9.kstest-单个样本分布的 Kolmogorov-Smirnov 测试

格式

H = kstest(X) %测试向量X是否服从标准正态分布,测试水平为5%.

H = kstest(X,cdf) %指定累积分布函数为cdf的测试(cdf=[ ]时表示标准正态分布),测试水平为5%

H = kstest(X,cdf,alpha) % alpha为指定测试水平

[H,P,KSSTAT,CV] = kstest(X,cdf,alpha) %P为原假设成立的几率,KSSTAT为测试统计量的值,CV为是否接受假设的临界值.

说明

   原假设为X服从标准正态分布.若H=0则不能拒绝原假设,H=1则能够拒绝原假设.

例4-82 产生100个威布尔随机数,测试该随机数服从的分布

>> x=weibrnd(1,2,100,1);

>> [H,p,ksstat,cv]=kstest(x,[x weibcdf(x,1,2)],0.05) %测试是否服从威布尔分布

H =0

p =0.3022

ksstat =0.0959

cv =0.1340

说明

  H=0表示接受原假设,统计量ksstat小于临界值表示接受原假设.

>> [H,p,ksstat,cv]=kstest(x,[x expcdf(x,1)],0.05) %测试是否服从指数分布

H =1

p =0.0073

ksstat =0.1653

cv =0.1340

说明 H=1代表拒绝服从指数分布的假设.

>> [H,p,ksstat,cv]=kstest(x,[ ],0.05) %测试是否服从标准正态分布

H =1

p =3.1285e-026

ksstat =0.5380

cv =0.1340

说明 H=1代表不服从标准正态分布.

10.kstest2-两个样本具备相同的连续分布的假设检验

格式

H = kstest2(X1,X2) %测试向量X1与X2是具备相同的连续分布,测试水平为5%.

H = kstest2(X1,X2,alpha) % alpha为测试水平

[H,P,KSSTAT] = kstest(X,cdf,alpha) %与指定累积分布cdf相同的连续分布,P为假设成立的几率,KSSTAT为测试统计量的值.

说明

原假设为具备相同连续分布.测试结果为H,若H=0,表示应接受原假设;若H=1,表示能够拒绝原假设.这是Kolmogorov-Smirnov测试方法.

例4-83

>> x=-1:1:5;

>> y=randn(20,1);

>> [h,p,k]=kstest2(x,y)

h =1

p =0.0444

k =0.5643

说明 h=1表示能够认为向量x与y的分布不相同,相同的几率只有4.4%.

相关文章
相关标签/搜索