精华内容
下载资源
问答
  • 基于包钢6号高炉的生产数据,建立差分时间序列的自回归分布滞后模型对高炉铁水硅含量进行预测.结果表明:在炉况波动较小的情况下,该模型的预测命中率能达到87.5%,对实际的生产操作过程有一定的指导意义.
  • 数学建模-自回归分布滞后模型(ADL)的运用实验指导.zip
  • 文章目录分布滞后与自回归模型@[toc]1 滞后效应与滞后变量模型1.1 什么是滞后效应1.2 滞后效应产生的原因1.3 滞后变量模型1.31 分布滞后模型1.32 自回归模型2 分布滞后模型的估计2.1 分布滞后模型估计的问题2.2 经验...

    分布滞后与自回归模型

    1 滞后效应与滞后变量模型

    1.1 什么是滞后效应

    解释变量对被解释变量的影响可能存在持续性或滞后性,也就是说解释变量需要通过一段时间才能完全作用于被解释变量。由于经济活动的惯性,经济变量变化态势往往会延续到本期,形成被解释变量的当期变化同自身过去取值水平相关的情形。


    1.2 滞后效应产生的原因

    • 心理预期因素
    • 技术因素
    • 制度因素

    1.3 滞后变量模型

    滞后变量是指过去时期的、对当前被解释变量产生影响的变量。滞后变量可分为滞后解释变量与滞后被解释变量两类。把滞后变量引入回归模型,这种回归模型称为滞后变量模型。滞后变量模型的一般形式为
    Y t = α + β 0 X t + β 1 X t − 1 + β 2 X t − 2 + ⋯ + β s X t − s + γ 1 Y t − 1 + γ 2 Y t − 2 + ⋯ + γ q Y t − q + u t \begin{array}{c} Y_{t}=\alpha+\beta_{0} X_{t}+\beta_{1} X_{t-1}+\beta_{2} X_{t-2}+\cdots+\beta_{s} X_{t-s} \\ +\gamma_{1} Y_{t-1}+\gamma_{2} Y_{t-2}+\cdots+\gamma_{q} Y_{t-q}+u_{t} \end{array} Yt=α+β0Xt+β1Xt1+β2Xt2++βsXts+γ1Yt1+γ2Yt2++γqYtq+ut
    其中s、q 分别为滞后解释变量和滞后被解释变量的滞后期长度。根据滞后长度是否有划分为有限滞后变量模型无限滞后变量模型

    1.31 分布滞后模型

    滞后变量模型仅有滞后解释变量而无滞后被解释变量模型,即
    Y t = α + β 0 X t + β 1 X t − 1 + β 2 X t − 2 + ⋯ + β s X t − s + u t Y_{t}=\alpha+\beta_{0} X_{t}+\beta_{1} X_{t-1}+\beta_{2} X_{t-2}+\cdots+\beta_{s} X_{t-s}+u_{t} Yt=α+β0Xt+β1Xt1+β2Xt2++βsXts+ut
    其中 β 0 \beta_0 β0称为短期效应或短期乘数,表示本期 X X X变动一个单位对 Y Y Y的影响; β i ( i = 1 , 2 …   ) \beta_i(i=1,2\dots) βi(i=1,2)为延迟乘数或动态乘数,表示过去各期X 变动一个单位对 Y Y Y值的影响大小。 ∑ i s β i \sum_i^s\beta_i isβi称为长期乘数或总分布乘数。

    1.32 自回归模型

    滞后变量模型仅有滞后被解释变量与本期解释变量 X t X_t Xt模型(可以不含 X X X),即
    Y t = α + β 0 X t + γ 1 Y t − 1 + γ 2 Y t − 2 + ⋯ + γ q Y t − q + u t Y_{t}=\alpha+\beta_{0} X_{t}+\gamma_{1} Y_{t-1}+\gamma_{2} Y_{t-2}+\cdots+\gamma_{q} Y_{t-q}+u_{t} Yt=α+β0Xt+γ1Yt1+γ2Yt2++γqYtq+ut
    称为自回归模型,其中 q q q为自回归阶数。


    2 分布滞后模型的估计

    2.1 分布滞后模型估计的问题

    • 自由度问题:随着滞后阶数增加,需要估计的参数增多,样本容量一定时,自由度下降
    • 多重共线性问题:滞后变量之间一般存在高度相关
    • 滞后长度难以确定

    2.2 经验加权估计法

    对解释变量的系数赋予一定权数,利用这些权数构成各滞后变量的线性组合,以形成新的变量再应用最小二乘法进行估计。权数分布的确定取决于模型滞后结构的不同类型,常见的滞后结构类型有:

    • 递减滞后结构:随着滞后阶数增加,权重递减
    • 不变滞后结构:随着滞后阶数增加,权重不变
    • Λ \Lambda Λ型滞后结构:随着滞后阶数增加,权重先增后减

    评价
    经验加权法具有简单易行、不损失自由度、避免多重共线性干扰及参数估计具有一致性等特点。但权数的主观随意性较大。


    2.3 阿尔蒙法

    为消除多重共线性的影响,阿尔蒙(Almon)提出利用多项式来逼近滞后参数的变化结构,从而减少待估参数的数目。在有限分布滞后模型滞后长度 s s s已知的情况下,滞后项系数可以看成是相应滞后期 i i i的函数。在以滞后期 i i i为横轴、滞后系数取值为纵轴的坐标系中,如果这些滞后系数落在一条光滑曲线上,或近似落在一条光滑曲线上,则可以由一个关于 i i i的次数较低的 m m m次多项式很好地逼近,即
    β i = α 0 + α 1 i + α 2 i 2 + ⋯ + α m i m i = 0 , 1 , 2 , ⋯   , s ; m < s \beta_{i}=\alpha_{0}+\alpha_{1} i+\alpha_{2} i^{2}+\cdots+\alpha_{m} i^{m} \quad i=0,1,2, \cdots, s ; \quad m<s βi=α0+α1i+α2i2++αmimi=0,1,2,,s;m<s
    此式称为阿尔蒙多项式变换。具体地,
    i = 0 β 0 = α 0 + α 1 0 + α 2 0 2 + ⋯ + α m 0 m i = 1 β 1 = α 0 + α 1 1 + α 2 1 2 + ⋯ + α m 1 m i = 2 β 2 = α 0 + α 1 2 + α 2 2 2 + ⋯ + α m 2 m … … … … … … … … … i = s β s = α 0 + α 1 s + α 2 S 2 + ⋯ + α m s m \begin{array}{cl} i=0 & \beta_{0}=\alpha_{0}+\alpha_{1} 0+\alpha_{2} 0^{2}+\cdots+\alpha_{m} 0^{m} \\ i=1 & \beta_{1}=\alpha_{0}+\alpha_{1} 1+\alpha_{2} 1^{2}+\cdots+\alpha_{m} 1^{m} \\ i=2 & \beta_{2}=\alpha_{0}+\alpha_{1} 2+\alpha_{2} 2^{2}+\cdots+\alpha_{m} 2^{m} \\ & \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \\ i=s & \beta_{s}=\alpha_{0}+\alpha_{1} s+\alpha_{2} S^{2}+\cdots+\alpha_{m} s^{m} \end{array} i=0i=1i=2i=sβ0=α0+α10+α202++αm0mβ1=α0+α11+α212++αm1mβ2=α0+α12+α222++αm2mβs=α0+α1s+α2S2++αmsm
    代入模型 Y t = α + β 0 X t + β 1 X t − 1 + β 2 X t − 2 + ⋯ + β s X t − s + u t Y_{t}=\alpha+\beta_{0} X_{t}+\beta_{1} X_{t-1}+\beta_{2} X_{t-2}+\cdots+\beta_{s} X_{t-s}+u_{t} Yt=α+β0Xt+β1Xt1+β2Xt2++βsXts+ut并整理
    Y t = α + α 0 ( X t + X t − 1 + X t − 2 + ⋯ + X t − s ) + α 1 ( X t − 1 + 2 X t − 2 + 3 X t − 3 ⋯ + s X t − s ) + α 2 ( X t − 1 + 2 2 X t − 2 + 3 2 X t − 3 ⋯ + s 2 X t − s ) ⋮ + α m ( X t − 1 + 2 m X t − 2 + 3 m X t − 3 ⋯ + s m X t − s ) + u t \begin{aligned} Y_{t}=\alpha &+\alpha_{0}\left(X_{t}+X_{t-1}+X_{t-2}+\cdots+X_{t-s}\right) \\ &+\alpha_{1}\left(X_{t-1}+2 X_{t-2}+3 X_{t-3} \cdots+s X_{t-s}\right) \\ &+\alpha_{2}\left(X_{t-1}+2^{2} X_{t-2}+3^{2} X_{t-3} \cdots+s^{2} X_{t-s}\right) \\ & \vdots \\ &+\alpha_{m}\left(X_{t-1}+2^{m} X_{t-2}+3^{m} X_{t-3} \cdots+s^{m} X_{t-s}\right) \\ &+u_{t} \end{aligned} Yt=α+α0(Xt+Xt1+Xt2++Xts)+α1(Xt1+2Xt2+3Xt3+sXts)+α2(Xt1+22Xt2+32Xt3+s2Xts)+αm(Xt1+2mXt2+3mXt3+smXts)+ut

    Y t = α + α 0 Z 0 t + α 1 Z 1 t + α 2 Z 2 t + ⋯ + α m Z m t + u t (1) Y_{t}=\alpha+\alpha_{0} Z_{0 t}+\alpha_{1} Z_{1 t}+\alpha_{2} Z_{2 t}+\cdots+\alpha_{m} Z_{m t}+u_{t}\tag{1} Yt=α+α0Z0t+α1Z1t+α2Z2t++αmZmt+ut(1)
    其中
    Z 0 t = X t + X t − 1 + X t − 2 + ⋯ + X t − s Z 1 t = X t − 1 + 2 X t − 2 + 3 X t − 3 ⋯ + s X t − s Z 2 t = X t − 1 + 2 2 X t − 2 + 3 2 X t − 3 ⋯ + s 2 X t − s ⋮ Z m t = X t − 1 + 2 m X t − 2 + 3 m X t − 3 ⋯ + s m X t − s \begin{array}{l} Z_{0 t}=X_{t}+X_{t-1}+X_{t-2}+\cdots+X_{t-s} \\ Z_{1 t}=X_{t-1}+2 X_{t-2}+3 X_{t-3} \cdots+s X_{t-s} \\ Z_{2 t}=X_{t-1}+2^{2} X_{t-2}+3^{2} X_{t-3} \cdots+s^{2} X_{t-s} \\ \vdots \\ Z_{m t}=X_{t-1}+2^{m} X_{t-2}+3^{m} X_{t-3} \cdots+s^{m} X_{t-s} \end{array} Z0t=Xt+Xt1+Xt2++XtsZ1t=Xt1+2Xt2+3Xt3+sXtsZ2t=Xt1+22Xt2+32Xt3+s2XtsZmt=Xt1+2mXt2+3mXt3+smXts
    为滞后变量的线性组合变量。若(1)式扰动项 μ t \mu_t μt满足经典假设条件,则可以采取OLS估计参数 α i ( i = 0 , 1 , … m ) \alpha_i(i=0,1,\dots m) αi(i=0,1,m)。在实际操作中 m = 2 , 3 m = 2,3 m=2,3很少取到4.


    3 自回归模型构建

    3.1 库伊克(Koyck)模型

    对于如下无限分布滞后模型
    Y t = α + β 0 X t + β 1 X t − 1 + β 2 X t − 2 + ⋯ + u t (2) Y_{t}=\alpha+\beta_{0} X_{t}+\beta_{1} X_{t-1}+\beta_{2} X_{t-2}+\cdots+u_{t}\tag{2} Yt=α+β0Xt+β1Xt1+β2Xt2++ut(2)
    可以假定滞后解释变量 X t − i X_{t-i} Xti对被解释变量 Y Y Y的影响随着滞后期 i ( i = 0 , 1 , 2 , …   ) i(i=0,1,2,\dots) i(i=0,1,2,)的增加而
    按几何级数衰减,即
    β i = β 0 λ i , 0 < λ < 1 , i = 0 , 1 , 2 , ⋯ (3) \beta_{i}=\beta_{0} \lambda^{i} , 0<\lambda<1 ,i=0,1,2, \cdots\tag{3} βi=β0λi,0<λ<1,i=0,1,2,(3)
    其中 β 0 \beta_0 β0为常数,公比 λ \lambda λ为待估参数。 λ \lambda λ值的大小决定了滞后衰减的速度, λ \lambda λ值越接近零,衰减速度越快,通常称 λ \lambda λ为分布滞后衰减率,称 1 − λ 1-\lambda 1λ为调整速度。将(3)代入(2)得
    Y t = α + β 0 X t + β 0 λ X t − 1 + β 0 λ 2 X t − 2 + ⋯ + u t = α + β 0 ( X t + λ X t − 1 + λ 2 X t − 2 + ⋯   ) + u t = α + β 0 ∑ i = 0 ∞ λ i X t − i + u t (4) \begin{aligned} Y_{t} &=\alpha+\beta_{0} X_{t}+\beta_{0} \lambda X_{t-1}+\beta_{0} \lambda^{2} X_{t-2}+\cdots+u_{t} \\ &=\alpha+\beta_{0}\left(X_{t}+\lambda X_{t-1}+\lambda^{2} X_{t-2}+\cdots\right)+u_{t} \\ &=\alpha+\beta_{0} \sum_{i=0}^{\infty} \lambda^{i} X_{t-i}+u_{t} \end{aligned}\tag{4} Yt=α+β0Xt+β0λXt1+β0λ2Xt2++ut=α+β0(Xt+λXt1+λ2Xt2+)+ut=α+β0i=0λiXti+ut(4)
    将(4)滞后一期,并乘以 λ \lambda λ, Y t Y_t Yt减之
    Y t − λ Y t − 1 = ( α + β 0 ∑ i = 0 ∞ λ i X t − i + u t ) − ( λ α + β 0 ∑ i = 1 ∞ λ i X t − i + λ u t − 1 ) = α ( 1 − λ ) + β 0 X t + ( u t − λ u t − 1 ) \begin{aligned} Y_{t}-\lambda Y_{t-1} &=\left(\alpha+\beta_{0} \sum_{i=0}^{\infty} \lambda^{i} X_{t-i}+u_{t}\right)-\left(\lambda \alpha+\beta_{0} \sum_{i=1}^{\infty} \lambda^{i} X_{t-i}+\lambda u_{t-1}\right) \\ \\ &=\alpha(1-\lambda)+\beta_{0} X_{t}+\left(u_{t}-\lambda u_{t-1}\right) \end{aligned} YtλYt1=(α+β0i=0λiXti+ut)(λα+β0i=1λiXti+λut1)=α(1λ)+β0Xt+(utλut1)

    Y t = α ( 1 − λ ) + β 0 X t + λ Y t − 1 + ( u t − λ u t − 1 ) Y_{t}=\alpha(1-\lambda)+\beta_{0} X_{t}+\lambda Y_{t-1}+\left(u_{t}-\lambda u_{t-1}\right) Yt=α(1λ)+β0Xt+λYt1+(utλut1)
    上述变换过程称为库伊克变换。令 α ∗ = ( 1 − λ ) α , β 0 ∗ = β 0 , β 1 ∗ = λ , u t ∗ = u t − λ u t − 1 \alpha^{*}=(1-\lambda) \alpha \quad, \quad \beta_{0}^{*}=\beta_{0} \quad, \quad \beta_{1}^{*}=\lambda \quad, \quad u_{t}^{*}=u_{t}-\lambda u_{t-1} α=(1λ)α,β0=β0,β1=λ,ut=utλut1则库伊克模型为
    Y t = α ∗ + β 0 ∗ X t + β 1 ∗ Y t − 1 + u t ∗ Y_{t}=\alpha^{*}+\beta_{0}^{*} X_{t}+\beta_{1}^{*} Y_{t-1}+u_{t}^{*} Yt=α+β0Xt+β1Yt1+ut
    这是一个 A R ( 1 ) AR(1) AR(1)过程。库伊克(Koyck)模型也存在局限

    • 假定无限滞后分布呈几何滞后结构,不具有普适性
    • 新模型的随机扰动项 μ t ∗ \mu_t^* μt存在一阶自相关,且与解释变量 Y t − 1 Y_{t-1} Yt1相关。
    • 将随机变量 Y t − 1 Y_{t-1} Yt1作为解释变量引入了模型,不一定符合基本假定。
    • 库伊克变换是纯粹的数学运算结果,缺乏经济理论依据。

    3.2 自适应预期模型

    将解释变量预期值引入模型建立“期望模型”。例如,包含一个预期解释变量的“期望模型”可以表现为如下形式:
    Y t = α + β X t ∗ + u t (5) Y_{t}=\alpha+\beta X_{t}^{*}+u_{t}\tag{5} Yt=α+βXt+ut(5)
    其中 Y t Y_t Yt为被解释变量, X t ∗ X_t^* Xt为解释变量预期值, μ t \mu_t μt为随机扰动项。自适应预期假定认为,经济活动主体对某经济变量的预期,是通过一种简单的学习过程而行成的,其机理是,经济活动主体会根据自己过去在作预期时所犯错误的程度,来修正他们以后每一时期的预期,即按照过去预测偏差的某一比例对当前期望进行修正,使其适应新的经济环境。用数学式子表示就是
    X t ∗ = X t − 1 ∗ + γ ( X t − X t − 1 ∗ ) (6) X_{t}^{*}=X_{t-1}^{*}+\gamma\left(X_{t}-X_{t-1}^{*}\right)\tag{6} Xt=Xt1+γ(XtXt1)(6)
    其中参数 λ \lambda λ为调节系数,也称为适应系数。将(6)代入(5)得
    Y t = α + β [ γ X t + ( 1 − γ ) X t − 1 ∗ ] + u t Y_{t}=\alpha+\beta\left[\gamma X_{t}+(1-\gamma) X_{t-1}^{*}\right]+u_{t} Yt=α+β[γXt+(1γ)Xt1]+ut
    通过变形得到
    Y t = α ∗ + β 0 ∗ X t + β 1 ∗ Y t − 1 + u t ∗ Y_{t}=\alpha^{*}+\beta_{0}^{*} X_{t}+\beta_{1}^{*} Y_{t-1}+u_{t}^{*} Yt=α+β0Xt+β1Yt1+ut
    其中 α ∗ = γ α , β 0 ∗ = γ β , β 1 ∗ = 1 − γ , u t ∗ = u t − ( 1 − γ ) u t − 1 \alpha^{*}=\gamma \alpha, \quad \beta_{0}^{*}=\gamma \beta, \quad \beta_{1}^{*}=1-\gamma, \quad u_{t}^{*}=u_{t}-(1-\gamma) u_{t-1} α=γα,β0=γβ,β1=1γ,ut=ut(1γ)ut1这是一个 A R ( 1 ) AR(1) AR(1)过程。


    3.3 局部调整模型

    解释变量的现值影响着被解释变量的预期值,即存在如下关系
    Y t ∗ = α + β X t + u t (7) Y_{t}^{*}=\alpha+\beta X_{t}+u_{t}\tag{7} Yt=α+βXt+ut(7)
    其中,局部调整假设认为,被解释变量的实际变化仅仅是预期变化的一部分,即
    Y t − Y t − 1 = δ ( Y t ∗ − Y t − 1 ) (8) Y_{t}-Y_{t-1}=\delta\left(Y_{t}^{*}-Y_{t-1}\right)\tag{8} YtYt1=δ(YtYt1)(8)
    其中 δ \delta δ为调整系数,它代表调整速度。 δ \delta δ越接近1,表明调整到预期最佳水平的速度越快。若 δ = 1 \delta =1 δ=1,则 Y t = Y t ∗ Y_t = Y_t^* Yt=Yt,表明实际变动等于预期变动,调整在当期完全实现。若 δ = 0 \delta =0 δ=0,则 Y t = Y t − 1 Y_t = Y_{t-1} Yt=Yt1表明本期值与上期值一样,完全没有调整。一般情况下, 0 < δ < 1 0<\delta<1 0<δ<1。将(8)变型并将(7)代入(8)得
    Y t = α ∗ + β 0 ∗ X t + β 1 ∗ Y t − 1 + u t ∗ Y_{t}=\alpha^{*}+\beta_{0}^{*} X_{t}+\beta_{1}^{*} Y_{t-1}+u_{t}^{*} Yt=α+β0Xt+β1Yt1+ut
    其中 α ∗ = δ α , β 0 ∗ = δ β , β 1 ∗ = 1 − δ , u t ∗ = δ u t \alpha^{*}=\delta \alpha, \quad \beta_{0}^{*}=\delta \beta, \quad \beta_{1}^{*}=1-\delta, \quad u_{t}^{*}=\delta u_{t} α=δα,β0=δβ,β1=1δ,ut=δut

    库伊克模型、自适应预期模型与局部调整模型的最终形式,都是一阶自回归形式,这样,对这三类模型的估计就转化为对相应一阶自回归模型的估计。


    4 自回归模型的估计

    4.1 自回归模型的困难

    关于随机扰动项

    • 库伊克模型: u t ∗ = u t − λ u t − 1 u_{t}^{*}=u_{t}-\lambda u_{t-1} ut=utλut1

    • 自适应预期模型: u t ∗ = u t − ( 1 − γ ) u t − 1 u_{t}^{*}=u_{t}-(1-\gamma) u_{t-1} ut=ut(1γ)ut1

    • 局部调整模型: u t ∗ = δ u t u_{t}^{*}=\delta u_{t} ut=δut

    假定上述三种原中随机扰动项 μ t \mu_t μt满足古典假定,即 E ( μ t ) = 0 E(\mu_t) = 0 E(μt)=0, V a r ( μ t ) = σ 2 Var(\mu_t) = \sigma^2 Var(μt)=σ2, C o v ( μ t , μ s ) = 0 ( t ≠ s ) Cov(\mu_t,\mu_{s}) =0 (t\ne s) Cov(μt,μs)=0(t=s)。对于库伊克模型,存在自相关性与内生性
    Cov ⁡ ( u t ∗ , u t − 1 ∗ ) = E ( u t − λ u t − 1 − E ( u t − λ u t − 1 ) ) ( u t − 1 − λ u t − 2 − E ( u t − 1 − λ u t − 2 ) ) = E ( u t u t − 1 ) − λ E u t − 1 2 − λ E ( u t u t − 2 ) + λ 2 E ( u t − 1 u t − 2 ) = − λ E u t − 1 2 = − λ σ 2 ≠ 0 \begin{array}{l} \operatorname{Cov}\left(u_{t}^{*}, u_{t-1}^{*}\right)=E\left(u_{t}-\lambda u_{t-1}-E\left(u_{t}-\lambda u_{t-1}\right)\right)\left(u_{t-1}-\lambda u_{t-2}-E\left(u_{t-1}-\lambda u_{t-2}\right)\right) \\ \\ =E\left(u_{t} u_{t-1}\right)-\lambda E u_{t-1}^{2}-\lambda E\left(u_{t} u_{t-2}\right)+\lambda^{2} E\left(u_{t-1} u_{t-2}\right) \\ \\ =-\lambda E u_{t-1}^{2}=-\lambda \sigma^{2} \neq 0 \end{array} Cov(ut,ut1)=E(utλut1E(utλut1))(ut1λut2E(ut1λut2))=E(utut1)λEut12λE(utut2)+λ2E(ut1ut2)=λEut12=λσ2=0
    Cov ⁡ ( Y t − 1 , u t ∗ ) = Cov ⁡ ( Y t − 1 , u t − λ u t − 1 ) = Cov ⁡ ( Y t − 1 , u t ) − λ Cov ⁡ ( Y t − 1 , u t − 1 ) − λ Cov ⁡ ( Y t − 1 , u t − 1 ) ≠ 0 \begin{array}{l} \operatorname{Cov}\left(Y_{t-1}, u_{t}^{*}\right)=\operatorname{Cov}\left(Y_{t-1}, u_{t}-\lambda u_{t-1}\right) =\operatorname{Cov}\left(Y_{t-1}, u_{t}\right)-\lambda \operatorname{Cov}\left(Y_{t-1}, u_{t-1}\right) \\-\lambda \operatorname{Cov}\left(Y_{t-1}, u_{t-1}\right) \neq 0 \end{array} Cov(Yt1,ut)=Cov(Yt1,utλut1)=Cov(Yt1,ut)λCov(Yt1,ut1)λCov(Yt1,ut1)=0

    对于自适应预期模型也存在自相关与内生性,即
    Cov ⁡ ( u t ∗ , u t − 1 ∗ ) ≠ 0 ; Cov ⁡ ( u t ∗ , Y t − 1 ) ≠ 0 \operatorname{Cov}\left(u_{t}^{*}, u_{t-1}^{*}\right) \neq 0;\operatorname{Cov}\left(u_{t}^{*}, Y_{t-1}\right) \neq 0 Cov(ut,ut1)=0Cov(ut,Yt1)=0
    局部调整模型不存在自相关与内生性
    Cov ⁡ ( u t ∗ , u t − 1 ∗ ) = E ( δ u t − E ( δ u t ) ) ( δ u t − 1 − E ( δ u t − 1 ) ) = δ 2 E ( u t u t − 1 ) = 0 Cov ⁡ ( Y t − 1 , u t ∗ ) = Cov ⁡ ( Y t − 1 , δ u t ) = δ Cov ⁡ ( Y t − 1 , u t ) = 0 \begin{array}{l} \operatorname{Cov}\left(u_{t}^{*}, u_{t-1}^{*}\right)=E\left(\delta u_{t}-E\left(\delta u_{t}\right)\right)\left(\delta u_{t-1}-E\left(\delta u_{t-1}\right)\right)=\delta^{2} E\left(u_{t} u_{t-1}\right)=0 \\ \\ \operatorname{Cov}\left(Y_{t-1}, u_{t}^{*}\right)=\operatorname{Cov}\left(Y_{t-1}, \delta u_{t}\right)=\delta \operatorname{Cov}\left(Y_{t-1}, u_{t}\right)=0 \end{array} Cov(ut,ut1)=E(δutE(δut))(δut1E(δut1))=δ2E(utut1)=0Cov(Yt1,ut)=Cov(Yt1,δut)=δCov(Yt1,ut)=0
    由上述模型可知,自回归模型可能存在内生性与自相关问题。为此可以通过工具变量法解决。


    4.2工具变量法

    工具变量的选择应满足如下条件:

    • 与所代替的解释变量高度相关;
    • 与随机扰动项不相关;
    • 与其它解释变量不相关,以免出现多重共线性。

    可以证明,利用工具变量法所得到的参数估计是一致估计。在时间序列中,可用 Y ^ t − 1 \hat{Y}_{t-1} Y^t1作为 Y t − 1 Y_{t-1} Yt1的工具变量,于是一阶自回归模型可写为
    Y t = α ∗ + β 0 ∗ X t + β 1 ∗ Y ^ t − 1 + u t ∗ Y_{t}=\alpha^{*}+\beta_{0}^{*} X_{t}+\beta_{1}^{*} \hat{Y}_{t-1}+u_{t}^{*} Yt=α+β0Xt+β1Y^t1+ut
    其中 Y ^ t − 1 \hat{Y}_{t-1} Y^t1 Y ^ t \hat{Y}_t Y^t的滞后值, Y ^ t \hat{Y}_t Y^t如下确定
    Y ^ t = c ^ 0 + c ^ 1 X t − 1 + c ^ 2 X t − 2 + ⋯ + c ^ s X t − s \hat{Y}_{t}=\hat{c}_{0}+\hat{c}_{1} X_{t-1}+\hat{c}_{2} X_{t-2}+\cdots+\hat{c}_{s} X_{t-s} Y^t=c^0+c^1Xt1+c^2Xt2++c^sXts
    s s s一般取2,3。


    4.3 德宾h-检验

    若自变量包括被解释变量滞后值,则DW检验不再适用。为此,德宾提出了检验一阶自相关的 h h h统计量检验法。h统计量为
    h = ρ ^ n 1 − n Var ⁡ ( β ^ 1 ∗ ) = ( 1 − d 2 ) n 1 − n Var ⁡ ( β ^ 1 ∗ ) h=\hat{\rho} \sqrt{\frac{n}{1-n \operatorname{Var}\left(\hat{\beta}_{1}^{*}\right)}}=\left(1-\frac{d}{2}\right) \sqrt{\frac{n}{1-n \operatorname{Var}\left(\hat{\beta}_{1}^{*}\right)}} h=ρ^1nVar(β^1)n =(12d)1nVar(β^1)n
    其中, ρ ^ \hat{\rho} ρ^为随机扰动项一阶自相关系数 ρ \rho ρ的估计量,d为DW统计量, n n n为样本容量, V a r ( β ^ 1 ∗ ) {Var}\left(\hat{\beta}_{1}^{*}\right) Var(β^1)为滞后被解释变量 Y t − 1 Y_{t-1} Yt1的回归系数的估计方差。德宾证明了在 ρ = 0 \rho = 0 ρ=0的假定下, h h h统计量的极限分布为标准正态分布。在大样本情况下,可以用 h h h统计量值判断随机扰动项是否存在一阶自相关

    • 对一阶自回归方程

    Y t = α ∗ + β 0 ∗ X t + β 1 ∗ Y t − 1 + u t ∗ Y_{t}=\alpha^{*}+\beta_{0}^{*} X_{t}+\beta_{1}^{*} Y_{t-1}+u_{t}^{*} Yt=α+β0Xt+β1Yt1+ut

    直接进行最小二乘估计,得到 V a r ( β ^ 1 ∗ ) {Var}\left(\hat{\beta}_{1}^{*}\right) Var(β^1) d d d统计量值。将 V a r ( β ^ 1 ∗ ) {Var}\left(\hat{\beta}_{1}^{*}\right) Var(β^1) d d d及样本容量 n n n代入h 统计量值。给定显著性水平 α \alpha α,查标准正态分布表得临界值 h α h_\alpha hα。若 ∣ h ∣ > h α |h|>h_\alpha h>hα,则拒绝原假设 ρ = 0 \rho = 0 ρ=0,反之不拒绝。


    -END-

    参考文献

    庞皓. 计量经济学[M].科学出版社

    更多内容,关注公众号“那由他的学习笔记”

    展开全文
  • [精选]动态经济模型自回归模型和分布滞后模型(ppt 58).pptx
  • 动态经济模型自回归模型和分布滞后模型.ppt
  • 动态经济模型自回归模型和分布滞后模型.pptx
  • 动态经济模型:自回归模型和分布滞后模型.ppt
  • [精选]动态经济模型:自回归模型和分布滞后模型.pptx
  • [精选]动态经济模型自回归模型和分布滞后模型(1).pptx
  • [精选]动态经济自回归模型与分布滞后模型分析.pptx
  • 分布滞后模型

    千次阅读 2021-01-31 21:15:26
    即模型中不仅包含解释变量的当前值,还包含它们的滞后值(过去值),这样的模型称为分布滞后模型(distribution-lag model),不能直接使用最小二乘法(OLS)估计,会遇到多重共线性、损失自由度、滞后长度难以确定...

    在涉及时间序列数据的回归分析中,一般由于经济变量自身、决策者心理、技术、制度等方面的原因,解释变量需要经过一段时间才能完全作用于因变量,同时由于经济活动的连续性,因变量的当前变化也往往受到自身过去取值水平的影响,即模型中不仅包含解释变量的当前值,还包含它们的滞后值(过去值),这样的模型称为分布滞后模型(distribution-lag model)。
    分布滞后模型可表示为:
    y t = α + β 0 x t + β 1 x t − 1 + β 2 x t − 2 + ⋯ + β k x t − k + μ t ( 1 ) {{y}_{t}}=\alpha +{{\beta }_{0}}{{x}_{t}}+{{\beta }_{1}}{{x}_{t-1}}+{{\beta }_{2}}{{x}_{t-2}}+\cdots +{{\beta }_{k}}{{x}_{t-k}}+{{\mu }_{t}} (1) yt=α+β0xt+β1xt1+β2xt2++βkxtk+μt(1)

    y t = α + β 0 x t + β 1 x t − 1 + β 2 x t − 2 + ⋯ + μ t ( 2 ) {{y}_{t}}=\alpha +{{\beta }_{0}}{{x}_{t}}+{{\beta }_{1}}{{x}_{t-1}}+{{\beta }_{2}}{{x}_{t-2}}+\cdots +{{\mu }_{t}}(2) yt=α+β0xt+β1xt1+β2xt2++μt(2)
    式(1)为有限滞后模型,式(2)为无限滞后模型。其中 k k k为滞后解释变量的滞后期长度。

    例:消费滞后。按照一般规律,人们的消费不仅依赖于当期收入,还依赖于前期收入,即人们会分期消费。假定某人收入每年增加1000元,那么这种收入的增加对该消费者的年消费支出会产生什么影响?它也许会在收入增加后的第一年增加400元的消费支出,第二年增加300元,第三年增加200元,把余下的100元作为储蓄。到第三年末此人的消费将增加900元。则消费函数为 y t = α + 0.4 x t + 0.3 x t − 1 + 0.2 x t − 2 + μ t {{y}_{t}}=\alpha +0.4{{x}_{t}}+0.3{{x}_{t-1}}+0.2{{x}_{t-2}}+{{\mu }_{t}} yt=α+0.4xt+0.3xt1+0.2xt2+μt
    在这里插入图片描述
    分布滞后模型的核心思想是多元回归,其一般步骤为:
    (1)确定滞后期;
    (2)选择适当的方法对模型进行估计;
    (3)对所得的回归方程和回归系数进行显著性检验;
    (4)分析滞后效应。

    第一步:确定滞后期

    对于分布滞后模型,首先要确定能够达到的最大滞后期,可以从一个很大的滞后期开始,而不对分布滞后的形状施加任何约束,然后看模型的拟合是否会随滞后期的减小而恶化。也可以通过一些统计检验获取信息,通过多个统计检验综合判断。常用的统计检验有:

    (1)相关系数

    对于序列 X = { x 1 , x 2 , ⋯   , x n } X=\left\{ {{x}_{1}},{{x}_{2}},\cdots ,{{x}_{n}} \right\} X={x1,x2,,xn} Y = { y 1 , y 2 , ⋯   , y n } Y=\left\{ {{y}_{1}},{{y}_{2}},\cdots ,{{y}_{n}} \right\} Y={y1,y2,,yn},二者在滞后 l l l处的相关系数
    R ( l ) = ∑ t = l + 1 n ( x t − x ˉ ) ( y t − l − y ˉ ) ∑ t = l + 1 n ( x t − x ˉ ) 2 ∑ t = 1 n − l ( y t − y ˉ ) 2 R\left( l \right)=\frac{\sum\limits_{t=l+1}^{n}{\left( {{x}_{t}}-\bar{x} \right)\left( {{y}_{t-l}}-\bar{y} \right)}}{\sqrt{\sum\limits_{t=l+1}^{n}{{{\left( {{x}_{t}}-\bar{x} \right)}^{2}}}}\sqrt{\sum\limits_{t=1}^{n-l}{{{\left( {{y}_{t}}-\bar{y} \right)}^{2}}}}} R(l)=t=l+1n(xtxˉ)2 t=1nl(ytyˉ)2 t=l+1n(xtxˉ)(ytlyˉ)
    x ˉ = 1 n − l ∑ t = l + 1 n x t , y ˉ = 1 n − l ∑ t = 1 n − l y t \bar{x}=\frac{1}{n-l}\sum\limits_{t=l+1}^{n}{{{x}_{t}}},\bar{y}=\frac{1}{n-l}\sum\limits_{t=1}^{n-l}{{{y}_{t}}} xˉ=nl1t=l+1nxt,yˉ=nl1t=1nlyt
    其中, l l l的最大取值为 n / 2 {}^{n}/{}_{2} n/2。当 l l l的值从0变化到 n / 2 {}^{n}/{}_{2} n/2时就可以得到多个 R ( l ) R\left( l \right) R(l),令 R ( l ) R\left( l \right) R(l)最大值所对应的滞后为 l max ⁡ {{l}_{\max }} lmax,如果 R ( l max ⁡ ) > σ ( σ ∈ [ 0 , 1 ] R\left( {{l}_{\max }} \right)>\sigma (\sigma \in \left[ 0,1 \right] R(lmax)>σσ[0,1]为用户定义的阈值),那么就说时间序列 X , Y X,Y X,Y具有滞后相关性。
    在这里插入图片描述
    由上图可知,当l=6时,R(l)最大,即居民蛋消费价格指数和棉花产值相关系数最大为0.77,若用户指定的阈值 σ > 0.5 \sigma>0.5 σ>0.5 ,则认为居民蛋消费价格指数和棉花产值具有滞后相关性,且棉花产值滞后于居民蛋消费价格指数的量为6。

    (2)调整的判定系数 R ˉ 2 {{\bar{R}}^{2}} Rˉ2

    依次添加滞后项,直到 R 2 {{R}^{2}} R2取得极大值,对应的滞后期为最优

    R ˉ 2 = 1 − ( 1 − R 2 ) n − 1 n − k − 1 , R 2 = E S S T S S = 1 − R S S T S S {{\bar{R}}^{2}}=1-\left( 1-{{R}^{2}} \right)\frac{n-1}{n-k-1},{{R}^{2}}=\frac{ESS}{TSS}=1-\frac{RSS}{TSS} Rˉ2=1(1R2)nk1n1,R2=TSSESS=1TSSRSS
    其中 R S S = ∑ i = 1 n ( y − y ^ ) 2 , E S S = ∑ i = 1 n ( y ^ − y ˉ ) 2 , T S S = ∑ i = 1 n ( y − y ˉ ) 2 RSS=\sum\limits_{i=1}^{n}{{{\left( y-\hat{y} \right)}^{2}}},ESS=\sum\limits_{i=1}^{n}{{{\left( \hat{y}-\bar{y} \right)}^{2}}},TSS=\sum\limits_{i=1}^{n}{{{\left( y-\bar{y} \right)}^{2}}} RSS=i=1n(yy^)2,ESS=i=1n(y^yˉ)2,TSS=i=1n(yyˉ)2分别为残差平方和、回归平方和、总平方和, n n n为数据数量, k k k为变量个数。

    (3)施瓦茨( S C SC SC)准则

    依次添加滞后项,直到 S C SC SC达到极小值,对应的滞后期为最优
    S C = ln ⁡ ( R S S n ) + k + 1 n ln ⁡ n SC=\ln \left( \frac{RSS}{n} \right)+\frac{k+1}{n}\ln n SC=ln(nRSS)+nk+1lnn
    其中 R S S = ∑ i = 1 n ( y − y ^ ) 2 RSS=\sum\limits_{i=1}^{n}{{{\left( y-\hat{y} \right)}^{2}}} RSS=i=1n(yy^)2为残差平方和, n n n为数据数量, k k k为变量个数。

    (4)赤池( A I C AIC AIC)准则

    依次添加滞后项,直到 A I C AIC AIC达到极小值,对应的滞后期为最优
    A I C = ln ⁡ ( R S S n ) + 2 ( k + 1 ) n AIC=\ln \left( \frac{RSS}{n} \right)+\frac{2\left( k+1 \right)}{n} AIC=ln(nRSS)+n2(k+1)
    其中 R S S = ∑ i = 1 n ( y − y ^ ) 2 RSS=\sum\limits_{i=1}^{n}{{{\left( y-\hat{y} \right)}^{2}}} RSS=i=1n(yy^)2为残差平方和, n n n为数据数量, k k k为变量个数。
    例如,有某产品1990年-2008年的库存和销售额数据。
    在这里插入图片描述
    依次添加滞后项,即当期时 Y t = α + β 0 X t {{Y}_{t}}=\alpha +{{\beta }_{0}}{{X}_{t}} Yt=α+β0Xt;添加滞后一期项时, Y t = α + β 0 X t + β 1 X t − 1 + β 2 x t − 2 + ⋯ + β k x t − k + μ t ( 1 ) {{Y}_{t}}=\alpha +{{\beta }_{0}}{{X}_{t}}+{{\beta }_{1}}{{X}_{t-1}}+{{\beta }_{2}}{{x}_{t-2}}+\cdots +{{\beta }_{k}}{{x}_{t-k}}+{{\mu }_{t}} (1) Yt=α+β0Xt+β1Xt1+β2xt2++βkxtk+μt(1);添加滞后二期项时, Y t = α + β 0 X t + β 1 X t − 1 + β 2 X t − 2 {{Y}_{t}}=\alpha +{{\beta }_{0}}{{X}_{t}}+{{\beta }_{1}}{{X}_{t-1}}+{{\beta }_{2}}{{X}_{t-2}} Yt=α+β0Xt+β1Xt1+β2Xt2…依次对各模型进行最小二乘法(OLS)估计,得到判定系数 R ˉ 2 {{\bar{R}}^{2}} Rˉ2 S C SC SC A I C AIC AIC,根据 S C SC SC A I C AIC AIC最小,判定系数 R ˉ 2 {{\bar{R}}^{2}} Rˉ2最大,最优滞后期应为2。
    在这里插入图片描述

    第二步:模型估计

    分布滞后模型估计不能直接使用最小二乘法(OLS)估计,会遇到多重共线性、损失自由度、滞后长度难以确定等问题。所以实践中很少用OLS方法直接估计分布滞后模型,一般使用限定诸 β \beta β遵从某种先验变化的模式或理论模式。对于有限分布滞后模型,常用的修正估计方法有经验加权法、阿尔蒙多项式法(Almon)等;对于无限分布滞后模型,主要通过适当的模型变换转化为自回归模型进行估计,代表性的方法有考伊克法(Koyck)等。下面介绍有限分布滞后模型的两种估计方法。

    (1)经验加权法

    根据实际经济问题的特点及经验判断,对滞后变量赋予一定的权数,利用这些权数构成各滞后变量的线性组合,以形成新的变量,再应用最小二乘法进行估计。基本思路是设法减少模型中被估计的参数个数,模型中参数的个数主要由解释变量的个数来决定,要减少模型中被估计的参数个数,就要对解释变量进行归并,并通过解释变量的归并,消除或削弱多重共线性问题。该方法的优点是简单易行、少损失自由度、避免多重共线性。缺点是权数设置主观随意性大。通常的做法是依据先验信息,多选几组权数进行估计模型,最后选择能通过统计和计量经济检验的模型。根据滞后结构特点,常使用的权数类型有:

    • 递减滞后结构
      例如,消费函数中近期收入对消费的影响较大,而远期收入的影响将越来越小;如果设滞后期为2,各期权数取成 1 / 2    , 1 / 4    , 1 / 6    {1}/{2}\;,{1}/{4}\;,{1}/{6}\; 1/2,1/4,1/6
      则组合成新的解释变量: w t = 1 2 x t + 1 4 x t − 1 + 1 6 x t − 2 {{w}_{t}}=\frac{1}{2}{{x}_{t}}+\frac{1}{4}{{x}_{t-1}}+\frac{1}{6}{{x}_{t-2}} wt=21xt+41xt1+61xt2
      估计模型(此时模型已无多重共线性): y t = α + β w t + ε t {{y}_{t}}=\alpha +\beta {{w}_{t}}+{{\varepsilon }_{t}} yt=α+βwt+εt
      用最小二乘法得到 α , β \alpha ,\beta α,β的估计值,将 w t {{w}_{t}} wt带入原模型得, β ^ 0 = β ^ 2 , β ^ 1 = β ^ 4 , β ^ 2 = β ^ 6 {{\hat{\beta }}_{0}}=\frac{{\hat{\beta }}}{2},{{\hat{\beta }}_{1}}=\frac{{\hat{\beta }}}{4},{{\hat{\beta }}_{2}}=\frac{{\hat{\beta }}}{6} β^0=2β^,β^1=4β^,β^2=6β^
    • 不变滞后结构
      设滞后期为2,各期权数为 1 / 3    {1}/{3}\; 1/3,则 w t = 1 3 ( x t + x t − 1 + x t − 2 ) {{w}_{t}}=\frac{1}{3}\left( {{x}_{t}}+{{x}_{t-1}}+{{x}_{t-2}} \right) wt=31(xt+xt1+xt2)
      同理得到原模型各参数的估计值为: β ^ i = β ^ 3 {{\hat{\beta }}_{i}}=\frac{{\hat{\beta }}}{3} β^i=3β^
    • A型滞后结构
      例如,历年投资对产出的影响一般为A型滞后结构,设滞后期为4,各期权数为 1 / 6    , 1 / 4    , 1 / 2    , 1 / 4    , 1 / 6    {1}/{6}\;,{1}/{4}\;,{1}/{2}\;,{1}/{4}\;,{1}/{6}\; 1/6,1/4,1/2,1/4,1/6,则 w t = 1 6 x t + 1 4 x t − 1 + 1 2 x t − 2 + 1 4 x t − 3 + 1 6 x t − 4 {{w}_{t}}=\frac{1}{6}{{x}_{t}}+\frac{1}{4}{{x}_{t-1}}+\frac{1}{2}{{x}_{t-2}}+\frac{1}{4}{{x}_{t-3}}+\frac{1}{6}{{x}_{t-4}} wt=61xt+41xt1+21xt2+41xt3+61xt4
      同理得到原模型各参数的估计值 β ^ 0 = β ^ 6 , β ^ 1 = β ^ 4 , β ^ 2 = β ^ 2 , β ^ 3 = β ^ 4 , β ^ 4 = β ^ 6 {{\hat{\beta }}_{0}}=\frac{{\hat{\beta }}}{6},{{\hat{\beta }}_{1}}=\frac{{\hat{\beta }}}{4},{{\hat{\beta }}_{2}}=\frac{{\hat{\beta }}}{2},{{\hat{\beta }}_{3}}=\frac{{\hat{\beta }}}{4},{{\hat{\beta }}_{4}}=\frac{{\hat{\beta }}}{6} β^0=6β^,β^1=4β^,β^2=2β^,β^3=4β^,β^4=6β^
      在这里插入图片描述
    (2)阿尔蒙(Almon)多项式法

    为了消除多重共线性的影响,阿尔蒙于1965年提出利用有限多项式来减少待估计参数的个数,以消除多重共线性及参数估计中的自由度损失。现实生活中,解释变量系数随滞后期的变化轨迹并不完全遵从几何级数衰减的假定,其变化形式多种多样。
    在这里插入图片描述
    对于有限分布滞后模型
    y t = α + β 0 x t + β 1 x t − 1 + β 2 x t − 2 + ⋯ + β k x t − k + μ t {{y}_{t}}=\alpha +{{\beta }_{0}}{{x}_{t}}+{{\beta }_{1}}{{x}_{t-1}}+{{\beta }_{2}}{{x}_{t-2}}+\cdots +{{\beta }_{k}}{{x}_{t-k}}+{{\mu }_{t}} yt=α+β0xt+β1xt1+β2xt2++βkxtk+μt
    可改写为
    y t = α + ∑ i = 0 k β i x t − i + μ t {{y}_{t}}=\alpha +\sum\limits_{i=0}^{k}{{{\beta }_{i}}{{x}_{t-i}}}+{{\mu }_{t}} yt=α+i=0kβixti+μt
    其中 β i = a 0 + a 1 i + a 2 i 2 + a 3 i 3 + ⋯ + a m i m {{\beta }_{i}}={{a}_{0}}+{{a}_{1}}i+{{a}_{2}}{{i}^{2}}+{{a}_{3}}{{i}^{3}}+\cdots +{{a}_{m}}{{i}^{m}} βi=a0+a1i+a2i2+a3i3++amim,一般多项式次数 m m m取2或者3,很少超过4;且多项式的次数 m m m小于最大滞后期 k k k。即参数 β i {{\beta }_{i}} βi可近似的用一个关于滞后期 i i i的低阶多项式表示,进而减少模型中的参数。取 m = 2 m=2 m=2为例进一步说明阿尔蒙方法,有阿尔蒙多项分布滞后模型
    在这里插入图片描述
    其中, z 0 t = ∑ i = 0 k x t − i , z 1 t = ∑ i = 0 k i x t − i , z 2 t = ∑ i = 0 k i 2 x t − i {{z}_{0t}}=\sum\limits_{i=0}^{k}{{{x}_{t-i}}},{{z}_{1t}}=\sum\limits_{i=0}^{k}{i{{x}_{t-i}}},{{z}_{2t}}=\sum\limits_{i=0}^{k}{{{i}^{2}}{{x}_{t-i}}} z0t=i=0kxti,z1t=i=0kixti,z2t=i=0ki2xti。如果随机误差项 μ \mu μ满足经典线性回归的假定,该模型仍可采用最小二乘法估计,且 α \alpha α a i {{a}_{i}} ai的估计值将具有全部的优良统计性质。估计出诸 a a a,进而估计出原始的 β \beta β系数
    在这里插入图片描述
    阿尔蒙多项式的应用示例。
    在这里插入图片描述
    阿尔蒙方法的优点:在阿尔蒙模型中,解释变量不再是x,而是x的线性组合,多重线性可以相对减弱;在使用阿尔蒙方法时,不必担心因滞后变量出现可能产生的估计问题(非随机解释变量和序列相关问题),它依然可以用最小二乘法进行估计;可以拟合一个足够低次的多项式,使估计系数的个数要比原先的系数的个数少很多。
    阿尔蒙方法的缺点:(a)滞后期的最大长度和多项式的次数是一种主观判断。若选择了过小的长度将导致“漏掉有关变量”的偏倚,这时系数虽然可以用OLS估计,但系数的方差不那么有效;(b)z变量的个数(m+1) 与m有关,一旦确定了滞后期k和多项式次数m就可以构造出诸z。然而z变量是x变量的线性组合,虽然多重共线问题可以减轻,但并不能消除。因此,在确定选择多项式的次数时,必须先肯定多重共线性的问题可以用前面给的技术方法进行处理。

    第三步:模型检验与评估

    • 回归方程的显著性检验

    统计量: F = E S S / k R S S / ( n − k − 1 ) ∼ F ( k , n − k − 1 ) F=\frac{ESS/k}{RSS/\left( n-k-1 \right)}\sim F\left( k,n-k-1 \right) F=RSS/(nk1)ESS/kF(k,nk1)
    其中 R S S = ∑ i = 1 n ( y − y ^ ) 2 , E S S = ∑ i = 1 n ( y ^ − y ˉ ) 2 RSS=\sum\limits_{i=1}^{n}{{{\left( y-\hat{y} \right)}^{2}}},ESS=\sum\limits_{i=1}^{n}{{{\left( \hat{y}-\bar{y} \right)}^{2}}} RSS=i=1n(yy^)2,ESS=i=1n(y^yˉ)2分别为残差平方和、回归平方和, n n n为数据数量, k k k为变量个数。若 F > F α F>{{F}_{\alpha }} F>Fα p < α p<\alpha p<α,则回归方程显著。

    • 回归系数的显著性检验
      统计量: t i = β ^ i / l i i R S S / ( n − k − 1 ) ∼ t ( n − k − 1 ) {{t}_{i}}=\frac{{{{\hat{\beta }}}_{i}}/\sqrt{{{l}^{ii}}}}{\sqrt{RSS/\left( n-k-1 \right)}}\sim t\left( n-k-1 \right) ti=RSS/(nk1) β^i/lii t(nk1)
      其中 R S S = ∑ i = 1 n ( y − y ^ ) 2 RSS=\sum\limits_{i=1}^{n}{{{\left( y-\hat{y} \right)}^{2}}} RSS=i=1n(yy^)2为残差平方和, n n n为数据数量, k k k为变量个数, l i i {{l}^{ii}} lii L − 1 {{L}^{-1}} L1的第 i i i个对角元素,而 L − 1 = X ~ ′ X ~ {{L}^{-1}}={\tilde{X}}'\tilde{X} L1=X~X~, X ~ \tilde{X} X~是中心化的数据阵。若 t > t α t>{{t}_{\alpha }} t>tα p < α p<\alpha p<α,则回归系数显著。
      在这里插入图片描述
    • 回归直线对观测值的拟合程度
      拟合优度 R 2 {{R}^{2}} R2 R 2 = E S S T S S = 1 − R S S T S S {{R}^{2}}=\frac{ESS}{TSS}=1-\frac{RSS}{TSS} R2=TSSESS=1TSSRSS
      调整的判定系数 R ˉ 2 {{\bar{R}}^{2}} Rˉ2 R ˉ 2 = 1 − ( 1 − R 2 ) n − 1 n − k − 1 {{\bar{R}}^{2}}=1-\left( 1-{{R}^{2}} \right)\frac{n-1}{n-k-1} Rˉ2=1(1R2)nk1n1
      其中 R S S = ∑ i = 1 n ( y − y ^ ) 2 , E S S = ∑ i = 1 n ( y ^ − y ˉ ) 2 , T S S = ∑ i = 1 n ( y − y ˉ ) 2 RSS=\sum\limits_{i=1}^{n}{{{\left( y-\hat{y} \right)}^{2}}},ESS=\sum\limits_{i=1}^{n}{{{\left( \hat{y}-\bar{y} \right)}^{2}}},TSS=\sum\limits_{i=1}^{n}{{{\left( y-\bar{y} \right)}^{2}}} RSS=i=1n(yy^)2,ESS=i=1n(y^yˉ)2,TSS=i=1n(yyˉ)2分别为残差平方和、回归平方和、总平方和, n n n为数据数量, k k k为变量个数。 R 2 {{R}^{2}} R2 R ˉ 2 {{\bar{R}}^{2}} Rˉ2越接近于1,说明回归直线对观测值的拟合程度越好;反之,越接近于零说明回归直线对观测值的拟合程度越差。

    第四步:滞后效应分析

    分布滞后变量模型的各系数体现了解释变量的当期值和各期滞后值对被解释变量的不同影响程度。

    • 滞后效应的乘数分析
      对于分布滞后模型 y t = α + β 0 x t + β 1 x t − 1 + β 2 x t − 2 + ⋯ + β k x t − k + μ t {{y}_{t}}=\alpha +{{\beta }_{0}}{{x}_{t}}+{{\beta }_{1}}{{x}_{t-1}}+{{\beta }_{2}}{{x}_{t-2}}+\cdots +{{\beta }_{k}}{{x}_{t-k}}+{{\mu }_{t}} yt=α+β0xt+β1xt1+β2xt2++βkxtk+μt
      β 0 {{\beta }_{0}} β0:短期乘数,表示解释变量变化一个单位对同期被解释变量所产生的影响,即短期影响;
      β i ( i > 0 ) {{\beta }_{i}}(i>0) βi(i>0):延期乘数或动态乘数,反映解释变量在各滞后时期的单位变化对 y t {{y}_{t}} yt产生的影响,即滞后影响。
      ∑ i = 0 s β i \sum\limits_{i=0}^{s}{{{\beta }_{i}}} i=0sβi:为(s期)中期乘数,反映了解释变量对 y t {{y}_{t}} yt的s期累计影响;
      ∑ i = 0 ∞ β i \sum\limits_{i=0}^{\infty }{{{\beta }_{i}}} i=0βi:为长期乘数,表示 x t {{x}_{t}} xt变动一单位对 y t {{y}_{t}} yt产生的累计总影响。
      利用乘数可以分析解释变量对解释变量的滞后影响过程。
      例如, y ^ t = α ^ + 0.4 x t + 0.3 x t − 1 + 0.2 x t − 2 {{\hat{y}}_{t}}=\hat{\alpha }+0.4{{x}_{t}}+0.3{{x}_{t-1}}+0.2{{x}_{t-2}} y^t=α^+0.4xt+0.3xt1+0.2xt2,则短期乘数为0.4,延期乘数为0.3/0.2,长期乘数为0.9。即当收入增加1元时,消费者将在本期增加0.4元的消费,下一期增加0.3元,再下期增加0.2元,增加1元收入对消费的长期作用为0.9元。
    • 滞后效应的速度分析
      乘数效用比: D s = s = ∑ i = 0 s β i ∑ i = 0 ∞ β i {{D}_{s}}=\frac{s}{}\text{=}\frac{\sum\limits_{i=0}^{s}{{{\beta }_{i}}}}{\sum\limits_{i=0}^{\infty }{{{\beta }_{i}}}} Ds=s=i=0βii=0sβi
      D s {{D}_{s}} Ds为截止到第 s s s期为止的乘数效应比,它反映了 x t {{x}_{t}} xt的变动在经历 s s s期后,对 y t {{y}_{t}} yt的影响所达到的程度,使 D s {{D}_{s}} Ds达到某个百分比(如90%)的 s s s值越小,则作用时间越快,滞后时间越短。
      平均滞后时间: M L T = ∑ i = 0 ∞ i β i ∑ i = 0 ∞ β i MLT\text{=}\frac{\sum\limits_{i=0}^{\infty }{i{{\beta }_{i}}}}{\sum\limits_{i=0}^{\infty }{{{\beta }_{i}}}} MLT=i=0βii=0iβi
      M L T MLT MLT为平均滞后时间(或平均滞后),实际上是以各期延期乘数为权数的、各滞后期的加权平均数,反映了滞后期的平均长度,其值越小,则平均滞后期越短,表明 y y y x x x变化的反映速度越快。
      在这里插入图片描述
      ps:初衷是通过撰写博文记录自己所学所用,实现知识的梳理与积累;将其分享,希望能够帮到面临同样困惑的小伙伴儿。如发现博文中存在问题,欢迎随时交流~~
    展开全文
  • 教育资料
  • 主要介绍ARMA(p,q)模型的基本概念、协方差函数和谱密度等性质。

    自回归滑动平均模型

    A R M A ( p ,   q ) {\rm ARMA}(p,\,q) ARMA(p,q) 模型及其平稳解

    为了描述更多的平稳序列,把自回归模型和滑动平均模型结合起来就得到了自回归滑动平均模型,下面给出定义:

    { ε t } ∼ W N ( o ,   σ 2 ) \{\varepsilon_t\}\sim{\rm WN}(o,\,\sigma^2) {εt}WN(o,σ2) ,实系数多项式 A ( z ) A(z) A(z) B ( z ) B(z) B(z) 没有公共根,满足 b 0 = 1 b_0=1 b0=1 a p b q ≠ 0 a_pb_q\neq0 apbq=0
    A ( z ) = 1 − ∑ j = 1 p a j z j ≠ 0   ,      ∣ z ∣ ≤ 1   , A(z)=1-\sum_{j=1}^pa_jz^j\neq0 \ , \ \ \ \ |z|\leq1\ , A(z)=1j=1pajzj=0 ,    z1 ,

    B ( z ) = ∑ j = 0 q b j z j ≠ 0   ,      ∣ z ∣ < 1   , B(z)=\sum_{j=0}^qb_jz^j\neq0 \ , \ \ \ \ |z|<1 \ , B(z)=j=0qbjzj=0 ,    z<1 ,

    定义差分方程
    X t = ∑ j = 1 p a j X t − j + ∑ j = 0 q b j ε t − j   ,      t ∈ Z X_t=\sum_{j=1}^pa_jX_{t-j}+\sum_{j=0}^qb_j\varepsilon_{t-j} \ , \ \ \ \ t\in\Z Xt=j=1pajXtj+j=0qbjεtj ,    tZ
    是一个自回归滑动平均模型,简称为 A R M A ( p ,   q ) {\rm ARMA}(p,\,q) ARMA(p,q) 模型。

    利用推移算子可以将模型改写为
    A ( B ) X t = B ( B ) ε t   ,      t ∈ Z . A(\mathscr{B})X_t=B(\mathscr{B})\varepsilon_t \ , \ \ \ \ t\in\Z. A(B)Xt=B(B)εt ,    tZ.
    满足此模型的平稳序列被称为 A R M A ( p , q ) {\rm ARMA}(p,q) ARMA(p,q) 序列。

    定义 Φ ( z ) = A − 1 ( z ) B ( z ) \Phi(z)=A^{-1}(z)B(z) Φ(z)=A1(z)B(z) ,由于 A ( z ) A(z) A(z) 满足最小相位性条件,所以存在 ρ > 1 \rho>1 ρ>1 ,使得在 { z : ∣ z ∣ ≤ ρ } \{z:|z|\leq\rho\} {z:zρ} 内, Φ ( z ) \Phi(z) Φ(z) 解析,从而有泰勒展开式
    Φ ( z ) = A − 1 ( z ) B ( z ) = ∑ j = 0 ∞ ψ j z j   ,      ∣ z ∣ ≤ ρ . \Phi(z)=A^{-1}(z)B(z)=\sum_{j=0}^\infty\psi_jz^j \ , \ \ \ \ |z|\leq\rho . Φ(z)=A1(z)B(z)=j=0ψjzj ,    zρ.
    类似地,我们得到 A R M A ( p ,   q ) {\rm ARMA}(p,\,q) ARMA(p,q) 序列的唯一的平稳解:
    X t = A − 1 ( B ) B ( B ) ε t = Φ ( B ) ε t = ∑ j = 0 ∞ ψ j ε t − j   ,      t ∈ Z . X_t=A^{-1}(\mathscr{B})B(\mathscr{B})\varepsilon_t=\Phi(\mathscr{B})\varepsilon_t=\sum_{j=0}^\infty \psi_j\varepsilon_{t-j} \ , \ \ \ \ t\in\Z. Xt=A1(B)B(B)εt=Φ(B)εt=j=0ψjεtj ,    tZ.
    其中 { ψ j } \{\psi_j\} {ψj} 被称为 { X t } \{X_t\} {Xt} 的 Wold 系数。类似于 A R ( p ) {\rm AR}(p) AR(p) 序列的 Wold 系数, A R M A ( p ,   q ) {\rm ARMA}(p,\,q) ARMA(p,q) 序列也有 Wold 系数递推公式。

    a 0 = − 1 a_0=-1 a0=1 ,定义模型参数 a p = ( a 1 , a 2 , ⋯   , a p ) T \boldsymbol{a}_p=(a_1,a_2,\cdots,a_p)^{\rm T} ap=(a1,a2,,ap)T b q = ( b 1 , b 2 , ⋯   , b q ) T \boldsymbol{b}_q=(b_1,b_2,\cdots,b_q)^{\rm T} bq=(b1,b2,,bq)T ,补充定义当 k < 0 k<0 k<0 ψ k = 0 \psi_k=0 ψk=0 。我们可以得到 { ψ j } \{\psi_j\} {ψ