概念介绍

  • ARIMA预测模型
a、在ARIMA预测模型中,预测值表示为由最近的真实值和最近的预测偏差组成的线性函数,本章只讨论对非季节性时序创建 ARIMA模型的问题
b、ARIMA模型中,主要用于拟合具备 平稳性(或能够被转换为平稳序列)的时间序列,在一个平稳的时序中,序列的统计性质并不会随着时间的推移而改变,好比  的 均值方差都是恒定的。另外 对任意滞后阶数 k ,序列的自相关性不改变
c、拟合ARIMA模型前,都须要变换序列的值以保证 方差为常数对数变换是一种经常使用的变换方法,常见还有的Box-Cox变换[详见变量置换]
d、通常假定平稳性时序常数均值,这样的序列中确定不含有趋势项。 非平稳的时序能够经过差分来转换为平稳性序列
e、验证平稳性
    一、平稳性通常经过时序图直观判断,或者经过ADF(Augmented Dickey-Fuller)统计检验来验证平稳性假定
            a一、R中 tseries 包中的 adf.test() 可用来作 ADF检验,语句为 adf.test(ts),ts为检验的序列,如过结果显著,则认为序列知足平稳性
    二、若是方差不是常数,则须要数据作变换
    三、若有存在趋势项,则须要对其进行差分
    
总之,能够经过 ACF和PACF图来为ARIMA模型选定参数,平稳性是ARIMA模型中的一个重要假设,可经过数据变换和差分使得序列知足平稳性假定,后面能够拟合出有自回归(AutoRegressive,AR)项,移动平均(Moving Averages,MA)项或二者都有(ARMA)模型

  • 滞后阶数(lag)
a、时序的滞后阶数即咱们向后追溯的观测值数量
b、0阶滞后项(Lag 0):没有位移的时序;一阶滞后项(Lag 1):时序向左移动一位;二阶滞后项(Lag 2):时序向左移动两位,以此类推
c、lag(ts,k)函数变成 k 阶滞后,其中 ts 指代目标序列, k 为滞后项阶数
  • 自相关(autoccorelation)
a、自相关度量时序中各 观测值之间的相关性
b、 即一系列观测值( )和 k 时期以前的观测值()之间的相关性
c、AC1表示一阶滞序列和0阶序列间的相关性,AC2是二阶滞后序列与0阶滞后序列之间的相关性,以此类推
d、 自相关函数图(AutoCorrelatio Function pot,ACF图):由(AC1,AC2,... )构成的图,ACF图可用于 ARIMA 模型选择合适的参数,并评估最终模型的拟合效果

  • ACF图
    a、stats 包中的 acf()函数或者 forecast 包中的 Acf() 函数都可生成 ACF 图
    b、Acf(ts) 语句输出 ACF 图,其中 ts 为时序, 对于 k =1,2,...,18

  • 偏自相关性(partial autocorrelation)
a、当序列 之间的全部值( )带来的效应都被移除后,两个序列之间的相关性
b、对不一样的 k 值画出偏自相关图(PACF图)

  • PACF图
    a、stats  包中的 pacf() 和 forecast() 包中的 Pacf() 函数均可以绘制 PACF图
    b、Pacf(ts) 语句获得 ts 序列的 PACF图,该图可用找到 ARIMA 模型中最适宜的参数
   
  • 差分(differencing)
a、差分就是将时序中每个观测值  替换为
b、注意对序列的一次差分能够移除序列中的线性趋势,二次差分移除二次项趋势,三次差分移除三次项趋势,在实际操做中, 对序列进行两次以上的差分一般都是必要的
c、diff() 函数对序列进行差分,即 diff(ts,differences = d),其中 d即对序列 ts 的差分次数,默认值为 d=1。forecast 包中的 ndiffs()函数 能够找到最优 的 d 值,语句为 ndiffs(ts)
相关文章
相关标签/搜索