精华内容
下载资源
问答
  • 平稳序列随机性分析(SAS)

    千次阅读 2019-01-03 12:13:37
    文章目录非平稳序列随机性分析步骤一:平稳性检验步骤二:白噪声特性检验步骤三:模型定价步骤四:模型估计及优化步骤三的模型minic命令梳系数模型挑选条件最优模型步骤五:检验模型的有效性步骤六:预测 非平稳...

    非平稳序列的随机性分析

    例题、对1917年-1975年美国23岁妇女每万人生育率序列建模

    /*第一步:编程建立SAS数据集。*/
     goptions vsize=7cm hsize=10cm;
    data a4_8;
    input year x@@;
    dif=dif(x);
    cards;
    1917	183.1
    1918	183.9
    1919	163.1
    1920	179.5
    1921	181.4
    1922	173.4
    1923	167.6
    1924	177.4
    1925	171.7
    1926	170.1
    1927	163.7
    1928	151.9
    1929	145.4
    1930	145
    1931	138.9
    1932	131.5
    1933	125.7
    1934	129.5
    1935	129.6
    1936	129.5
    1937	132.2
    1938	134.1
    1939	132.1
    1940	137.4
    1941	148.1
    1942	174.1
    1943	174.7
    1944	156.7
    1945	143.3
    1946	189.7
    1947	212
    1948	200.4
    1949	201.8
    1950	200.7
    1951	215.6
    1952	222.5
    1953	231.5
    1954	237.9
    1955	244
    1956	259.4
    1957	268.8
    1958	264.3
    1959	264.5
    1960	268.1
    1961	264
    1962	252.8
    1963	240
    1964	229.1
    1965	204.8
    1966	193.3
    1967	179
    1968	178.1
    1969	181.1
    1970	165.6
    1971	159.8
    1972	136.1
    1973	126.3
    1974	123.3
    1975	118.5
    ;
    run;
    /* 画序列图,判断平稳性*/                          
    proc gplot data=a4_8;
    plot x*year dif*year;
    symbol c=black i=join v=square;
    run;  
    

    步骤一:平稳性检验

    原序列图
    一阶差分后序列图

    原序列的时序图具有明显长期趋势,表明原序列不平稳。

    差分后序列的时序图无明显趋势和周期性,可视为平稳序列。

    步骤二:白噪声特性检验

     /*对差分后的序列,作白噪声检验、画自相关图和偏自相关图,初步确定模型*/
    proc arima data=a4_8;
    identify var=x(1);   /* x变量1阶差分后的序列*/
    run;
    

    p值均小于0.05,因此该序列为白噪声序列

    步骤三:模型定价

    ACF自相关图
    PACF偏自相关图

    样本自相关图:延迟6阶后,自相关系数基本在零附近波动。
    样本偏自相关图: 除了延迟1阶和4阶的偏自相关系数显著大于2倍标准差,其他阶的偏自相关系数都比较小.

    模型定阶方式:

    • 将自相关系数看成拖尾,偏自相关系数看成4阶结尾,可构建AR(4)模型;

    • 将自相关系数看成6阶结尾,偏自相关系数看成拖尾,可构建MA(6)模型;

    • 采用SAS中minic命令,选择ARMA 6阶内的最优模型;

    步骤四:模型估计及优化

    步骤三的模型

    proc arima data=a4_8;
    identify  var=x(1);
    estimate p=4 ;
    estimate q=6 ;
    run;
    
    AR(4)模型

    1阶和4阶的p值分别是0.0258、0.0256,小于0.05,参数显著。

    MA(6)模型

    4阶和5阶的p值分别是0.0026、0.0088小于0.05,参数显著。

    minic命令

    proc arima data=a4_8;
    identify  var=x(1) minic p=(0:6) q=(0:6);
    run;
    proc arima data=a4_8;
    identify  var=x(1);
    estimate p=1 noint;
    run;
    
    上面结果表明:
    • AR(4)模型中只有滞后1,4阶的参数显著;

    • MA(6)模型中只有滞后4,5阶的参数显著;

    • minic命令模型筛选的结果是AR(1)

    将模型AR(4)、MA(6)中不显著的参数删掉,构建梳系数模型AR(1,4)、MA(4,5),输出结果如下:

    梳系数模型

    proc arima data=a4_8;
    identify var=x(1);   /* x1阶差分后的序列*/
    estimate p=(1 4) noint;
    estimate q=(4 5) noint;
    run;
    
    AR(1,4)模型
    MA(4,5)模型

    挑选条件最优模型

    模型 AIC SBC
    AR(4) 449.1606 457.4024
    MA(6) 448.295 460.6577
    梳系数模型MA(4,5) 444.6012 448.7221
    梳系数模型AR(1,4) 446.0726 450.19
    minic选出的AR(1) 451.0047 453.0651

    根据AIC和SBC准则,得到条件最优模型为梳系数模型MA(4,5),即ARIMA(0,1,(4,5))

    参数检验的p值都小于常用显著性水平0.05,得2个参数显著。

    在这里插入图片描述

    ARIMA(0,1,(4,5))模型口径
    (1B)xt=(1+0.42766B4+0.34172B5) (1-B)x_t=(1+0.42766B^4+0.34172B^5)

    Var(εt)=10.988982 Var(\varepsilon_t)=10.98898^2

    步骤五:检验模型的有效性

    proc arima data=a4_8;
    identify var=x(1);   /* x1阶差分后的序列*/
    estimate q=(4 5) noint;
    forecast lead=5 id=year out=a4_8out;
    run;
    
    延迟阶数6,12,18,24的p值都大于常用显著性水平0.05,得拟合模型显著有效。

    步骤六:预测

    proc gplot data=a4_8out;
    plot x*year=1 forecast*year=2 l95*year=3 u95*year=3/overlay;
    symbol1 c=black i=none v=star;
    symbol2 c=red i=join v=none;
    symbol3 c=green i=join v=none;
    run;
    

    平时习惯了图片居中的方式,因此这次文章的图片居中,参考CSDN Markdown编辑器改变图片对齐方式(居中,左对齐,右对齐)及改变图片大小
    感谢这位作者!

    展开全文
  • 时间序列平稳性检验与随机性检验

    万次阅读 多人点赞 2019-04-05 14:42:56
    2. 时间序列平稳性、随机性检验     对于一个时间序列,在进行建模之前,首先需要进行平稳性检验和纯随机性检验,然后根据检验的结果再选择适合的模型。在讲解平稳性和随机性的定义之前,我们先介绍一下时间...

    1. 时间序列的定义

    1.1 什么是时间序列

        在统计研究中,常用按时间顺序排列的一组随机变量X1,X2, ,Xt,X _ { 1 } , X _ { 2 } , \cdots , X _ { t } , \cdots来表示一个随机事件的时间序列,简记为{Xt,tT}\left\{ X _ { t } , t \in T \right\}{Xt}\left\{ X _ { t } \right\}。用x1,x2, ,xnx _ { 1 } , x _ { 2 } , \cdots , x _ { n }{xt,t=1,2, ,n}\left\{ x _ { t } , t = 1,2 , \cdots , n \right\}表示该序列的nn个有序观测值。时间序列在我们的日常生活中比比皆是,比如一支股票每小时的价格、一个公司每月份的营业收入等等。

    1.2 时间序列分析方法

        对于时间序列的分析方法一般可以分为两种,即描述性时序分析统计时序分析,描述性时序分析指的是通过可视化的形式观察时间序列的趋势,从中发现规律,而统计时序分析则表示通过一些统计学的方法来研究时间序列中的规律。统计时序分析又可以分为频域分析方法时域分析方法,其中,频域分析方法假设任何一种无趋势的时间序列都可以分解成若干不同频率的周期波动,从频率的角度来揭示时间序列的规律;而时域分析方法则从序列的自相关角度来揭示时间序列的规律,该方法假设序列值之间存在一定的相关关系,而这种相关关系具有一定的规律,通过模型来拟合这种规律,并利用模型来对预测未来的趋势进行预测。

    2. 时间序列的平稳性、随机性检验

        对于一个时间序列,在进行建模之前,首先需要进行平稳性检验和纯随机性检验,然后根据检验的结果再选择适合的模型。在讲解平稳性和随机性的定义之前,我们先介绍一下时间序列中常用的几个特征统计量。

    2.1 时间序列的特征统计量

        对于一个时间序列{Xt,tT}\left\{ X _ { t } , t \in T \right\},任意时刻的序列值XtX _ { t }都是一个随机变量,记其分布函数为Ft(x)F _ { t } ( x ),则其特征统计量均值、方差、自协方差函数、自相关系数的定义分别如下:

    • 均值:表示时间序列在各个时刻取值的平均值,其定义如下:
      μt=EXt=xdFt(x) \mu _ { t } = E X _ { t } = \int _ { - \infty } ^ { \infty } x \mathrm { d } F _ { t } ( x )
    • 方差:表示时间序列在各个时刻围绕其均值波动的平均程度,其定义如下:
      σt2=DXt=E(Xtμt)2=(xμt)2dFt(x) \sigma _ { t } ^ { 2 } = D X _ { t } = E \left( X _ { t } - \mu _ { t } \right) ^ { 2 } = \int _ { - \infty } ^ { \infty } \left( x - \mu _ { t } \right) ^ { 2 } \mathrm { d } F _ { t } ( x )
    • 自协方差函数:表示时间序列任意两个时刻直接的相关性,任取t,sTt , s \in T,则其定义如下:
      γ(t,s)=E[(Xtμt)(Xsμs)] \gamma ( t , s ) = E \left[ \left( X _ { t } - \mu _ { t } \right) \left( X _ { s } - \mu _ { s } \right) \right]
    • 自相关系数:同自协方差函数,其定义如下:
      ρ(t,s)=γ(t,s)DXtDXs \rho ( t , s ) = \frac { \gamma ( t , s ) } { \sqrt { D X _ { t } \cdot D X _ { s } } }

    2.2 平稳时间序列的定义与检验

    2.2.1 平稳时间序列的定义

        平稳时间序列按照限定条件的严格程度可以分为以下两种类型:

    • 严平稳时间序列:指时间序列的所有统计性质不会随着时间的推移而发生变化,即其联合概率分布在任何时间间隔都是相同的。设{Xt}\left\{ X _ { t } \right\}为一时间序列,对任意的正整数mm,任取t1,t2, ,tmTt _ { 1 } , t _ { 2 } , \cdots , t _ { m } \in T,对任意整数τ\tau,有:
      Ft1,t2, ,tm(x1,x2, ,xm)=Ft1+τ,t2+τ, ,tm+τ(x1,x2, ,xm) F _ { t _ { 1 } , t _ { 2 } , \cdots , t _ { m } } \left( x _ { 1 } , x _ { 2 } , \cdots , x _ { m } \right) = F _ { t _ { 1 + \tau } , t _ { 2 + \tau } , \cdots , t _ { m + \tau } } \left( x _ { 1 } , x _ { 2 } , \cdots , x _ { m } \right) 则称时间序列{Xt}\left\{ X _ { t } \right\}为严平稳时间序列。

    • 宽平稳时间序列:宽平稳时间序列则认为只要时间序列的低阶距(二阶)平稳,则该时间序列近似平稳。如果时间序列{Xt}\left\{ X _ { t } \right\}满足以下三个条件:

      • 任取tTt \in T,有EXt2<E X _ { t } ^ { 2 } < \infty
      • 任取tTt \in T,有EXt=μE X _ { t } = \mu,其中μ\mu为常数;
      • 任取t,s,kTt , s , k \in Tk+stTk + s - t \in T,有γ(t,s)=γ(k,k+st)\gamma ( t , s ) = \gamma ( k , k + s - t )

        在现实生活中,时间序列是很难满足严平稳时间序列的要求的,因此,一般所讲的平稳时间序列在默认情况下都是指宽平稳时间序列。根据宽平稳时间序列的条件,我们可以容易得到宽平稳时间序列所具有的性质:

    • 均值为常数,即:
      EXt=μ,tT E X _ { t } = \mu , \quad \forall t \in T
    • 自协方差函数和自相关系数只依赖于时间的平移长度,而与时间的起点无关。即:
      γ(t,s)=γ(k,k+st),t,s,kT \gamma ( t , s ) = \gamma ( k , k + s - t ) , \quad \forall t , s , k \in T 因此,可以记γ(k)\gamma ( k )为时间序列{Xt}\left\{ X _ { t } \right\}的延迟kk自协方差函数。
    • 方差也为均值,即:
      DXt=γ(t,t)=γ(0),tT D X _ { t } = \gamma ( t , t ) = \gamma ( 0 ) , \quad \forall t \in T

        由于平稳时间序列具有这些优良性质,因此,对于一个平稳时间序列来说,其待估计的参数量就变得少了很多,因为他们的均值、方差都是一样的,因此,可以利用全部的样本来估计总体的均值和方差,即:
    μ^=x=i=1nxinγ^(0)=t=1n(xtx)2n1 \widehat { \mu } = \overline { x } = \frac { \sum _ { i = 1 } ^ { n } x _ { i } } { n } \\ \widehat { \gamma } ( 0 ) = \frac { \sum _ { t = 1 } ^ { n } \left( x _ { t } - \overline { x } \right) ^ { 2 } } { n - 1 } 这也是为什么说当拿到一个时间序列后,需要对其进行平稳性检验。

    2.2.2 平稳时间序列的检验

        那么,当拿到一个时间序列后,应该如何对其进行平稳性的检验呢?目前,对时间序列的平稳性检验主要有两种方法,一种是图检法,即根据时序图和自相关图进行直观判断,另一种是构造检验统计量的方法,目前主要有单位根检验法。
        对于图检法,我们一般绘制时间序列的时序图,如下图所示,如果时间序列是平稳的,那么序列应该是围绕某一个均值上下随机波动,而下图中的序列明显具有一定的增长趋势,因此,可以断定该序列肯定不是平稳时间序列。
    图1 时序图
        另一方面,我们也可以通过自相关图来进行检验,对于平稳时间序列,其自相关图一般随着阶数的递增,自相关系统会迅速衰减至0附近,而非平稳时间序列则可能存在先减后增或者周期性波动等变动。如下图所示,该时间序列随着阶数的递增,自相关系数先减后增,因此,可以判断该时间序列不是平稳时间序列。
    在这里插入图片描述

    2.3 随机性时间序列的定义与检验

    2.3.1 随机性时间序列的定义

        通过对时间序列进行平稳性检验后,我们可以将时间序列分为平稳时间序列和非平稳时间序列,对于非平稳时间序列,一般需要将其转化为平稳时间序列再进行分析,具体的转化方法随后再讲。而对于平稳时间序列,我们知道其有一个性质,即自协方差函数和自相关系数只依赖于时间间隔,而与起点无关,对于相同的时间间隔,其自协方差函数和自相关系数为一个常数,那么,就存在一种情况,当该常数为0时,照样满足平衡时间序列的条件,而此时序列之间的相关性则为0,即序列之间不相关,那么,这时我们的分析即可结束,因为对于一个毫无相关的序列,我们没法从中挖掘出可用的规律,此时的序列即为随机性时间序列,也称为白噪声序列
        对于时间序列{Xt}\left\{ X _ { t } \right\},如果满足:

    • 任取tTt \in T,有EXt=μE X _ { t } = \mu
    • 任取t,sTt , s \in T,有
      γ(t,s)={σ2,t=s0,ts \gamma ( t , s ) = \left\{ \begin{array} { l l } { \sigma ^ { 2 } , } & { t = s } \\ { 0 , } & { t \neq s } \end{array} \right.

    则称该时间序列为纯随机序列或白噪声序列,简记为XtWN(μ,σ2)X _ { t } \sim W N \left( \mu , \sigma ^ { 2 } \right)。我们可以发现,其实白噪声序列的性质与平稳时间序列的性质一样,其均值和方差均为常数,只是自协方差函数或自相关系数为0,因此,该序列的任何两项之间不存在相关性,无法从中得到任何有用的信息,此时分析可以停止。

    2.3.2 纯随机性检验

        对于纯随机性序列,一般通过构建统计量的方法来检验。我们知道,白噪声序列除了0阶自相关系数外,即方差,其他阶的自相关系数应该均为0,因此,我们可以提出下面这样一个假设:
    H0:ρ1=ρ2==ρm=0,m1H1:ρk0,m1,km H _ { 0 } : \rho _ { 1 } = \rho _ { 2 } = \cdots = \rho _ { m } = 0 , \quad \forall m \geqslant 1\\ H _ { 1 } :至少存在某个\rho _ { k } \neq 0 , \quad \forall m \geqslant 1 , k \leqslant m 因此,围绕该假设,我们可以构建统计量进行检验,常用的统计量有Q统计量和LB统计量,其计算公式分别如下:
    Q=nk=1mρ^k2LB=n(n+2)k=1m(ρ^k2nk) Q = n \sum _ { k = 1 } ^ { m } \widehat { \rho } _ { k } ^ { 2 }\\L B = n ( n + 2 ) \sum _ { k = 1 } ^ { m } \left( \frac { \widehat { \rho } _ { k } ^ { 2 } } { n - k } \right) 其中,nn为序列的观察期数,mm为指定延迟期数,kk为延迟阶数,Box和Pierce证明这两个统计量均服从自由度为mm的卡方分布,当统计量大于χ1α2(m)\chi _ { 1 - \alpha } ^ { 2 } ( m )或者P值小于α\alpha时,则认为可以拒绝原假设,即认为该序列是非随机序列。

    展开全文
  • 用python处理时间序列数据,检验平稳性跟纯随机性

    用python处理时间序列数据,检验平稳性跟纯随机性

    from statsmodels.tsa.stattools import adfuller as adf
    from statsmodels.graphics.tsaplots import plot_acf, plot_pacf
    import pandas as pd
    import numpy as np
    
    !pip install statsmodels
    
    Requirement already satisfied: statsmodels in c:\programdata\anaconda3\lib\site-packages (0.11.0)
    Requirement already satisfied: numpy>=1.14 in c:\programdata\anaconda3\lib\site-packages (from statsmodels) (1.18.1)
    Requirement already satisfied: scipy>=1.0 in c:\programdata\anaconda3\lib\site-packages (from statsmodels) (1.4.1)
    Requirement already satisfied: pandas>=0.21 in c:\programdata\anaconda3\lib\site-packages (from statsmodels) (1.0.1)
    Requirement already satisfied: patsy>=0.5 in c:\programdata\anaconda3\lib\site-packages (from statsmodels) (0.5.1)
    Requirement already satisfied: pytz>=2017.2 in c:\programdata\anaconda3\lib\site-packages (from pandas>=0.21->statsmodels) (2019.3)
    Requirement already satisfied: python-dateutil>=2.6.1 in c:\programdata\anaconda3\lib\site-packages (from pandas>=0.21->statsmodels) (2.8.1)
    Requirement already satisfied: six in c:\programdata\anaconda3\lib\site-packages (from patsy>=0.5->statsmodels) (1.14.0)
    
    data=pd.read_excel('./data.xls',encoding='utf-8')
    data
    
    time wc(误差随机项) xt1 xt2 xt3
    0 1 1.74 1.000000 1.000 1.000
    1 2 -0.70 0.800000 0.800 0.800
    2 3 -1.28 2.650000 1.440 1.430
    3 4 0.43 7.440000 5.094 4.060
    4 5 0.24 13.804000 10.204 5.645
    ... ... ... ... ... ...
    95 96 1.55 739.086685 6908.698 146.490
    96 97 0.07 748.322011 7056.498 147.345
    97 98 -0.73 756.383207 7205.072 148.140
    98 99 0.66 765.129924 7356.450 150.725
    99 100 -0.44 773.187954 7508.420 151.515

    100 rows × 5 columns

    对X1做平稳性检验

    xt1=data.xt1
    dftest=adf(xt1)
    pd.Series(dftest[0:4],index=['Test Statistic','p-value','#Lags Used','Number of Observations Used'])
    #p值高达0.9几
    
    Test Statistic                  0.678947
    p-value                         0.989408
    #Lags Used                      1.000000
    Number of Observations Used    98.000000
    dtype: float64
    
    xt1.plot()
    
    <matplotlib.axes._subplots.AxesSubplot at 0x238faff6208>
    

    在这里插入图片描述

    [output_6_1.png)]

    #一阶差分
    xt1_1 = xt1.diff(1)
    xt1_1.plot()
    
    <matplotlib.axes._subplots.AxesSubplot at 0x238fa6a5048>
    

    在这里插入图片描述

    [(output_7_1.png)]

    #一阶差分的单位根检验
    dftest_1 = adf(xt1_1.dropna())
    pd.Series(dftest_1[0:4],index=['Test Statistic','p-value','#Lags Used','Number of Observations Used'])
    #一阶差分后p值小于0.05,拒绝原假设(即不存在单位根,认为其已经平稳)
    
    Test Statistic                -6.056515e+00
    p-value                        1.241430e-07
    #Lags Used                     0.000000e+00
    Number of Observations Used    9.800000e+01
    dtype: float64
    
    dftest_1[1]-0.05
    
    -0.049999875856979056
    
    #画一阶差分之后的自相关图跟偏自相关图
    plot_acf(xt1_1.dropna())
    

    在这里插入图片描述

    [(output_10_0.png)]

    plot_pacf(xt1_1.dropna())
    

    在这里插入图片描述

    [(output_11_0.png)]

    X2做平稳性检验

    data.xt2.plot()
    
    <matplotlib.axes._subplots.AxesSubplot at 0x238fe204d88>
    

    在这里插入图片描述

    (output_13_1.png)]

    #做二阶差分
    x2_2=data.Xt2一阶差分.diff(1)
    x2_2.plot()
    
    <matplotlib.axes._subplots.AxesSubplot at 0x238fc1d7a48>
    

    在这里插入图片描述

    [output_14_1.png)]

    #对二阶差分后的Xt2做单位根检验
    adf(x2_2.dropna())
    #故拒绝原假设,该序列平稳
    
    (-7.1910449486700525,
     2.5032477359463947e-10,
     4,
     93,
     {'1%': -3.502704609582561,
      '5%': -2.8931578098779522,
      '10%': -2.583636712914788},
     260.6359245108364)
    
    #画二阶差分后的Xt2的自相关图跟偏自相关图
    plot_acf(x2_2.dropna())
    

    在这里插入图片描述

    (output_16_0.png)]

    plot_pacf(x2_2.dropna())
    

    在这里插入图片描述

    (output_17_1.png)]

    对X3做平稳性检验

    data.xt3.plot()
    
    <matplotlib.axes._subplots.AxesSubplot at 0x238fd5efc08>
    

    在这里插入图片描述

    (output_19_1.png)]

    #做一阶差分
    data.xt3.diff(1).plot()
    
    <matplotlib.axes._subplots.AxesSubplot at 0x238ff5dac88>
    

    在这里插入图片描述

    (output_20_1.png)]

    #对一阶差分后的序列做单位根检验
    adf(data.xt3.diff(1).dropna())
    
    (-10.661639595719135,
     4.391819453885797e-19,
     1,
     97,
     {'1%': -3.4996365338407074,
      '5%': -2.8918307730370025,
      '10%': -2.5829283377617176},
     257.9188344687909)
    
    adf(data.xt3.diff(1).dropna())[1]-0.05
    #故拒绝原假设,该序列平稳
    
    -0.05
    
    #对一阶差分后的Xt3画出自相关图跟偏自相关图
    plot_acf(data.xt3.diff(1).dropna())
    

    在这里插入图片描述

    (output_23_1.png)]

    plot_pacf(data.xt3.diff(1).dropna())
    

    在这里插入图片描述

    (output_24_1.png)]

    
    
    展开全文
  • 模型介绍 ARIMA,差分自回归滑动平均模型,又称求自回归滑动平均模型,是时间序列预测分析方法之一。 ARIMA(p,d,q)中,AR是“自回归”,p为自回归...d是使之成为平稳序列所做的差分次数(阶数)。 1. ARIMA的优...

    参考链接:https://blog.csdn.net/linchuhai/article/details/87920764

    模型介绍

    ARIMA,差分自回归滑动平均模型,又称求自回归滑动平均模型,是时间序列预测分析方法之一。

    ARIMA(p,d,q)中,AR是“自回归”,p为自回归项数;MA是“滑动平均”,q为滑动平均项数;d是使之成为平稳序列所做的差分次数(阶数)。

    1. ARIMA的优缺点

    优点: 模型十分简单,只需要内生变量而不需要借助其他外生变量。

    缺点:

    1.要求时序数据是稳定的(stationary),或者是通过差分化(differencing)后是稳定的。

    2.本质上只能捕捉线性关系,而不能捕捉非线性关系。

    注意,采用ARIMA模型预测时序数据,必须是稳定的,如果不稳定的数据,是无法捕捉到规律的。比如股票数据用ARIMA无法预测的原因就是股票数据是非稳定的,常常受政策和新闻的影响而波动。

    2.ARIMA模型运用流程

    以《应用系统负载分析与磁盘容量预测》为案例:

    - (平稳性检验)根据时间序列的散点图、自相关系数和偏自相关系数、单位根检验(ADF),来判断数据的平稳性;

    - (平稳化处理)对非平稳的时间序列数据进行差分处理,得到差分阶数d;

    - (白噪声检测)为了验证序列中有用的信息是否已被提取完毕,如果为白噪声序列,说明序列中有用的信息已经被提取完毕,可以采用LB统计量的方法进行白噪声检验;

    - (模型识别和定阶)根据所识别出来的特征建立相应的时间序列模型。平稳化处理后,若偏自相关函数是截尾的,而自相关函数是拖尾的,则建立AR模型;若偏自相关函数是拖尾的,而自相关函数是截尾的,则建立MA模型;若偏自相关函数和自相关函数均是拖尾的,则序列适合ARIMA模型。可以采用BIC准则对模型进行定阶,确定p,q参数,从而选择最优模型;

    - (模型检验)检验已确定的模型其残差序列是否为白噪声,如果不是白噪声,说明残差中还存在有用的信息,需要修改模型或者进一步提取;

    -(模型预测)应用已通过检验的模型进行预测;

    3.平稳性检验

    (1)看图法

    这里的“图”指的是时序图,平稳序列的图a是围绕一个常数上下波动;而不平稳的图b,则是有明显的增长或减少的趋势。

    å¨è¿éæå¥å¾çæè¿°

    (2)自相关系数和偏自相关系数

    这里会涉及到两个定义——截尾和拖尾。

    微信æªå¾_20181003171718.png

    平稳序列的自相关图和偏相关图要么都是拖尾要么都是截尾。截尾就是在某阶之后,系数都为 0 ,怎么理解呢,看上面偏相关的图,当阶数为 1 的时候,系数值还是很大, 0.914. 二阶长的时候突然就变成了 0.050. 后面的值都很小,认为是趋于 0 ,这种状况就是截尾。再就是拖尾,拖尾就是有一个衰减的趋势,但是不都为 0 。自相关图既不是拖尾也不是截尾。以上的图的自相关是一个三角对称的形式,这种趋势是单调趋势的典型图形。

    (3)单位根检验(ADF)
    若单位根检验p值小于0.05则认为是平稳的。

    4.差分处理

    差分即取相邻项值差替代当前值,以此来消除一些波动,使数据趋于平稳。


    展开全文
  • 平稳性检验(描述性)与纯随机性检验

    万次阅读 多人点赞 2019-04-19 11:46:41
    本章主要介绍进行时序分析前的预处理,即平稳性检验与纯随机性检验平稳性检验(描述性) 平稳性检验的方法分为描述性方法与计量性方法。前者主要指时序图检验、ACF 图检验,后者主要指 DF 检验、ADF 检验与PP...
  • 本文档通过案例的形式展示了平稳性检验和纯随机性检验的完整过程、结果及具体分析,能让初学者更好的理解和掌握检验的真正作用,使知识更加融汇贯通。
  • 时间序列平稳性、随机性检验 在拿到时间序列数据后,首先要对数据的随机性和平稳性进行检测, 这两个检测是时间序列预测的重要部分。根据不同检测结果需要采取不同的分析方法。 为什么时间序列要求平稳性呢?平稳...
  • 序列平稳性与纯随机性检验,模型的有效性,参数的显著性,最优模型准则AIC,SBC data <- scan() 126.4 82.4 78.1 51.1 90.9 76.2 104.5 87.4 110.5 25 69.3 53.5 39.8 63.6 46.7 72.9 79.6 83.6 80.7 60.3 79 ...
  • 平稳性检验(描述性) 平稳性检验的方法分为描述性方法与计量性方法。前者主要指时序图检验、ACF 图检验,后者主要指 DF 检验、ADF 检验与PP检验。 如下两个模型: 原假设,备择假设 def ADF_p(start_...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 3,534
精华内容 1,413
关键字:

平稳序列的随机性检验