python 编写ADF 检验 ,代码结果参数所表示的含义

from statsmodels.tsa.stattools import adfuller

import numpy as np
import pandas as pd

adf_seq = np.array([1,2,3,4,5,7,5,1,54,3,6,87,45,14,24])

dftest = adfuller(adf_seq,autolag='AIC')

dfoutput = pd.Series(dftest[0:4],index=['Test Statistic','p-value','#Lags Used','Number of Observations Used'])

# 第一种显示方式

for key,value in dftest[4].items():

  dfoutput['Critical Value (%s)' % key] = value

  print(dfoutput)

# 第二种显示方式

print(dftest)

 

(1)第一种显示方式如图所示:测试

具体的参数含义以下所示:spa

Test  Statistic :  T值,表示T统计量code

p-value: p值,表示T统计量对应的几率值blog

Lags Used:表示延迟pandas

Number of Observations Used: 表示测试的次数it

Critical Value 1% :  表示t值下小于 - 4.938690 , 则原假设发生的几率小于1%, 其它的数值以此类推。io

其中t值和p值是最重要的,其实这两个值是等效的,既能够看t值也能够看p值。class

p值越小越好,要求小于给定的显著水平,p值小于0.05,等于0最好。test

t值,ADF值要小于t值,1%, 5%, 10% 的三个level,都是一个临界值,若是小于这个临界值,说明拒绝原假设。import

其中,1% : 严格拒绝原假设;  5%: 拒绝原假设; 10% 以此类推,程度愈来愈低。若是,ADF小于1% level, 说明严格拒绝原假设。

(2) 第二种表示方式,以下图所示:

第一个值(0.0): 表示Test  Statistic , 即T值,表示T统计量

第二个值(0.958532086060056):p-value,即p值,表示T统计量对应的几率值

第三个值(7):Lags Used,即表示延迟

第四个值(7):Number of Observations Used,即表示测试的次数

大括号中的值,分别表示1%, 5%, 10% 的三个level

查阅了资料,简单的作的总结经验。 

相关文章
相关标签/搜索