精华内容
下载资源
问答
  • Granger因果检验

    2018-02-27 15:28:14
    Granger因果检验的经典论文。值得每一个研究者细细品读
  • Granger因果检验和Sims因果检验的实证比较,王升,,本文通过实证研究了Granger因果关系和Sims因果关系的联系与区别,指出Granger原因存在预示着Sims原因一定存在,但是,Sims原因存在并不能�
  • 在别处看的一个用MATLAB写的一个GRANGER 因果检验程序,跟大家分享一下 在别处看的一个用MATLAB写的一个GRANGER 因果检验程序,跟大家分享一下
  • granger因果检验的matlab程序
  • VAR模型与Granger因果检验 单一方程时间序列模型探讨的是单个变量的动态规律性但在现实经济分析 中经常会面对由多个变量构成的系统而这些变量之间通常具有关联性因此 在一个经济系统中一个变量的变化不仅会与其自身...
  • 基于谱聚类-独立成分分析-Granger因果检验模型的金融风险协同溢出分析.pdf
  • 以1995—2017年山西省终端煤炭消费总量与地方生产总值两个指标为样本研究两者的关系,依次采用ADF检验法、EG两步法和Granger因果检验法对两变量序列的平稳性、协整关系和因果性进行验证分析。研究结果表明,在消费意义...
  • 论文研究-基于非线性Granger因果检验的中国大陆和世界其他主要股票市场之间的信息溢出.pdf, 采用线性及非线性Granger因果检验的方法,对中国大陆股票市场和世界其他主要...
  • 1.2 传统的 Granger 因果检验 1.3 VAR 模型中的不稳定性问题 1.4 稳健的 Granger 因果检验 2. 命令介绍 3. Stata 实例 3.1 实例说明 3.2 稳健的 Granger 因果检验 3.3 传统与稳健 Granger 因果检验...

    全文阅读:https://www.lianxh.cn/news/86be2903e11c5.html

    目录


    1. 引言

    1.1 VAR 模型

    VAR (Vector Autoregressive) 即向量自回归模型,由 Sims 在 1980 年提出,是指所有当期变量对所有变量的若干滞后项进行线性回归。在宏观经济模型的实证分析中,VAR 模型经常被用来分析变量间的动态变化关系。简单的 VAR 模型可以由单变量时间序列的 AR 过程推出,如二阶 VAR 模型:

    全文阅读:https://www.lianxh.cn/news/86be2903e11c5.html

    展开全文
  • 压缩包内为格兰杰非线性因果关系检验,针对非线性关系,包括C语言和MATLAB语言代码,亲测可用,欢迎下载~
  • Stata: 面板 Granger 因果检验

    万次阅读 2019-08-04 10:36:45
      作者:李珍 (厦门大学)...Source: Luciano Lopez, Sylvain Weber, 2017, Testing for Granger Causality in Panel Data, Stata Journal, 17(4): 972–984. [pdf] 连享会推文集锦 Stata连享会 精品专题 ...

    作者:李珍 (厦门大学)

    Stata 连享会: 知乎 | 简书 | 码云 | CSDN

    Source: Luciano Lopez, Sylvain Weber, 2017, Testing for Granger Causality in Panel Data, Stata Journal, 17(4): 972–984. [pdf]

    连享会计量方法专题……

    随着面板数据库规模的扩大,围绕面板数据因果关系的理论也迅速发展。面板数据正从具有大样本量( N )和较短时间维度( T )的微观面板数据转变为到具有大样本量( N )和长的时间维度(T)的宏观面板数据。在这种情况下,就需要注意时间序列计量经济学的经典问题,即(非)平稳性和(非)因果关系。

    在本文中,我们介绍了社区贡献的外部命令 xtgcause ,它实现了 Dumitrescu 和 Hurlin (2012) 提出的面板数据中 Granger 因果关系的检验过程。

    xtgcause 通过最小化 Akaike 信息准则 (AIC)、贝叶斯信息准则 (BIC) 和 Hannan-Quinn 信息准则 (HQIC) 来选择模型中的滞后阶数,同时,它提供了 bootstrap 方法来计算 p 值和临界值。

    1. Dumitrescu-Hurlin 检验 (DH 检验)

    1.1 Granger 因果检验的基本思想

    Granger (1969) 开创性地提出一种分析时间序列数据因果关系的方法。

    假设 x t x_{t} xt y t y_{t} yt 是两个平稳的序列,我们可以用如下模型来检验 x x x 是不是导致 y y y 变动的原因:

    y t = α + ∑ k = 1 K γ k y t − k + ∑ k = 1 K β k x t − k + ε t , t = 1 , … … , T ( 1 ) y_{t}=\alpha+\sum_{k=1}^{K} \gamma_{k} y_{t-k}+\sum_{k=1}^{K} \beta_{k} x_{t-k}+\varepsilon_{t},t=1,……,T \quad (1) yt=α+k=1Kγkytk+k=1Kβkxtk+εtt=1,T(1)

    其基本思想在于,在控制 y y y 的滞后项 (过去值) 的情况下,如果 x x x 的滞后项仍然有助于解释 y y y 的当期值的变动,则认为 x x x y y y 产生因果影响。

    检验的原假设为:

    H 0 : β 1 = ⋯ = β K = 0 H_{0} : \beta_{1} = \cdots =\beta_{K}=0 H0:β1==βK=0

    这可以通过构造 F 统计量进行检验。如果 F 检验拒绝 H 0 H_{0} H0 ,则认为存在因果关系,即 x x x y y y 的 Granger 因。显然,我们可以互换 x x x y y y 的位置,以便检验 y y y 是否为 x x x 的 Granger 因。在很多情况下都会出现模型中所有变量之间都存在双向因果关系。

    1.2 Dumitrescu-Hurlin 的拓展

    Dumitrescu-Hurlin (2012) 在此基础上进行了拓展,提供了一个检验面板数据因果关系的方法。潜在的回归模型是:

    y i , t = α i + ∑ k = 1 K γ i k y i , t − k + ∑ k = 1 K β i k x i , t − k + ε i , t ( 2 ) y_{i, t}=\alpha_{i}+\sum_{k=1}^{K} \gamma_{i k} y_{i, t-k}+\sum_{k=1}^{K} \beta_{i k} x_{i, t-k}+\varepsilon_{i, t} \quad (2) yi,t=αi+k=1Kγikyi,tk+k=1Kβikxi,tk+εi,t(2)

    其中, i = 1 , … … , N i=1,……,N i=1,,N t = 1 , … … , T t=1,……,T t=1,T x i , t x_{i, t} xi,t y i , t y_{i, t} yi,t 是两个平稳序列在个体 i i i 和时间 t t t 上的观测值。

    DH 的面板因果检验允许每个截面单元的回归系数是可变的(即在同一时间上,系数在个体之间不同)。假设滞后阶数 k k k 对于所有个体是相同的,并且面板必须是平稳的。

    类似于 Granger 因果检验,DH 检验也是通过 x x x 的过去值对 y y y 的现值的影响来判断因果关系。

    检验统计量

    原假设认为面板中的所有个体都不存在因果关系,即:

    H 0 : β i 1 = ⋯ = β i K = 0 ∀ i = 1 , … , N 1 ( 3 ) H_{0} : \beta_{i 1}=\cdots=\beta_{i K}=0 \quad \forall i=1, \ldots, N_{1} \quad (3) H0:βi1==βiK=0i=1,,N1(3)

    备择假设为部分(不是所有的)个体存在因果关系:

    H 1 : β i 1 = ⋯ = β i K = 0 ∀ i = 1 , … , N 1 β i 1 ≠ 0  or  …  or  β i K ≠ 0 ∀ i = N 1 + 1 , … , N \begin{array}{cc}{H_{1} : \beta_{i 1}=\cdots=\beta_{i K}=0} & {\forall i=1, \ldots, N_{1}} \\ {\beta_{i 1} \neq 0 \text { or } \ldots \text { or } \beta_{i K} \neq 0} & {\forall i=N_{1}+1, \ldots, N}\end{array} H1:βi1==βiK=0βi1̸=0 or  or βiK̸=0i=1,,N1i=N1+1,,N

    其中, N 1 ∈ [ 0 , N − 1 ] N_{1} \in[0, N-1] N1[0,N1] 是未知的。 如果 N 1 = 0 N_{1} = 0 N1=0 ,则面板中的所有个体都存在因果关系。 N 1 N_{1} N1 必须严格小于 N N N

    实现方法

    在实际操作方面,DH 提出运行包含在 (1) 式中的 N 个独立回归,执行 k k k 个线性假设的 F 检验来获得 Wald 统计量 W i W_{i} Wi ,最后计算 Wald 统计量的平均值

    W ‾ = 1 N ∑ i = 1 N W i \overline{W}=\frac{1}{N} \sum_{i=1}^{N} W_{i} W=N1i=1NWi

    DH 检验的目的在探索面板数据的因果关系,拒绝 H 0 H_{0} H0 并不排除一些个体的非因果关系。使用蒙特卡罗模拟(Monte Carlo Simulation), DH 发现 W W W 的渐进表现良好,可以用来检测面板因果关系。

    在 Wald 统计量 W i W_{i} Wi 是独立同分布的假设下,当 T → ∞ T \rightarrow \infty T N → ∞ N \rightarrow \infty N ,标准化的统计 $\widetilde{Z} $ 服从下面的正态分布:

    Z ‾ = N 2 K × ( W ‾ − K ) d T , N → ∞ ​​ → N ( 0 , 1 ) ( 4 ) \overline{Z}=\sqrt{\frac{N}{2 K}} \times(\overline{W}-K) \quad \frac{d}{T, N \rightarrow \infty}\!\!{\rightarrow} \quad \mathcal{N}(0,1) \quad (4) Z=2KN ×(WK)T,NdN(0,1)(4)

    而且,对一个 T > 5 + 3 K T>5+3K T>5+3K 的固定的 T T T 维度来说,最大标准统计量 Z Z Z 服从以下正态分布:

    Z ~ = N 2 K × T − 3 K − 5 T − 2 K − 3 × ( T − 3 K − 3 T − 3 K − 1 × W ‾ − K ) d T , N → ∞ ​​ → N ( 0 , 1 ) ( 5 ) \widetilde{Z}=\sqrt{\frac{N}{2 K} \times \frac{T-3 K-5}{T-2 K-3}} \times\left(\frac{T-3 K-3}{T-3 K-1} \times \overline{W}-K\right)\frac{d}{T, N \rightarrow \infty}\!\!{\rightarrow} \quad \mathcal{N}(0,1) \quad (5) Z =2KN×T2K3T3K5 ×(T3K1T3K3×WK)T,NdN(0,1)(5)

    原假设 (3) 的检验也是基于 Z ‾ \overline{Z} Z Z ~ \widetilde{Z} Z 。如果这些值大于标准化值,则拒绝原假设 H 0 H_{0} H0,认为 Granger 因果存在。对 N N N T T T 足够大的面板数据来说,使用 Z Z Z 统计量是合理的。对 N N N 足够大但 T T T 相对较小的面板数据而言,也可以使用 Z Z Z 统计量。对于 N N N T T T 都很小的样本数据而言, DH 用蒙特卡洛推断说明了检验具有良好的样本性。

    滞后阶数的选取

    滞后阶数 k k k 的选择是一个经验问题,但是 Dumitrescu 和 Hurlin ( 2012 ) 并没有说明。解决这个问题的一个方法就是根据信息准则( AIC / BIC / HQIC )选择滞后阶数。在这个过程中,所有估计都要被嵌套在公共样本中执行、进而可以进行比较。事实上,这意味着 K max ⁡ 3 K_{\max }^{3} Kmax3 时间序列在整个滞后选择过程中被忽略掉了。另一个需要考虑的现实问题是面板数据中的横截面依赖性。为此,在 Dumitrescu 和 Hurlin ( 2012 ) 在 6.2 节中提出了一个计算 bootstrapped 临界值而不是渐进临界值:具体步骤为:

    1. 拟合模型 (2),根据(4)和(5)中的定义获得 Z ‾ \overline{Z} Z Z ~ \widetilde{Z} Z
    2. H 0 : y i , t = α i 0 + ∑ k = 1 K γ i k 0 y i , t − k + ε i , t H_{0} : y_{i, t}=\alpha_{i}^{0}+\sum_{k=1}^{K} \gamma_{i k}^{0} y_{i, t-k}+\varepsilon_{i, t} H0:yi,t=αi0+k=1Kγik0yi,tk+εi,t 假设下拟合模型,得到残差矩阵 ε ^ ( T − K ) × N \widehat{\boldsymbol{\varepsilon}}(T-K) \times N ε (TK)×N
    3. 重新抽取矩阵 ε ^ \widehat{\varepsilon} ε ,形成 ε ^ ( T − K ) × N \widehat{\boldsymbol{\varepsilon}}(T-K) \times N ε (TK)×N
    4. 随机抽取 ( y 1 ⋆ , … , y K ⋆ ) ′ \left(\mathbf{y}_{\mathbf{1}}^{\star}, \ldots, \mathbf{y}_{\mathbf{K}}^{\star}\right)^{\prime} (y1,,yK) , 令 y t ⋆ = ( y 1 , t ⋆ , y 2 , t ⋆ , ⋯   , y N , t ⋆ ) \mathbf{y}_{\mathrm{t}}^{\star}=\left(y_{1, t}^{\star}, y_{2, t}^{\star}, \cdots, y_{N, t}^{\star}\right) yt=(y1,t,y2,t,,yN,t) ,其中 k k k 为可重复的连续时间序列 ;
    5. 根据 k k k 期随机抽取,构建 y i , t ⋆ = α ^ i 0 + ∑ k = 1 K β ^ i k 0 y i , t − k ⋆ + ε i , t ⋆ y_{i, t}^{\star}=\widehat{\alpha}_{i}^{0}+\sum_{k=1}^{K} \widehat{\beta}_{i k}^{0} y_{i, t-k}^{\star}+\varepsilon_{i, t}^{\star} yi,t=α i0+k=1Kβ ik0yi,tk+εi,t 重抽样序列;
    6. 拟合模型 y i , t ⋆ = α i b + ∑ k = 1 K γ i k b y i , t − k ⋆ + ∑ k = 1 K β i k b x i , t − k + ε i , t y_{i, t}^{\star}=\alpha_{i}^{b}+\sum_{k=1}^{K} \gamma_{i k}^{b} y_{i, t-k}^{\star}+\sum_{k=1}^{K} \beta_{i k}^{b} x_{i, t-k}+\varepsilon_{i, t} yi,t=αib+k=1Kγikbyi,tk+k=1Kβikbxi,tk+εi,t ,计算 Z ‾ b \overline{Z}^{b} Zb Z ~ b \widetilde{Z}^{b} Z b
    7. 重复步骤 3-6 ;
    8. 根据 Z ‾ b \overline{Z}^{b} Zb Z ~ b \widetilde{Z}^{b} Z b 的分布,计算 P 值、和 Z ‾ \overline{Z} Z Z ~ \widetilde{Z} Z 的标准值。

    DH 的面板因果是允许每个截面单元的回归系数可变的,因此 Z Z Z 统计量也是多个 Z Z Z 的平均值,叫做 z − b a r z-bar zbar 统计量。检验结果主要看最后一列相伴概率,可知所有变量都是双向因果的。

    连享会计量方法专题……

    2. xtgcasue 命令

    2.1 语法结构

    xtgcause depvar indepvar [if]  [in]  ///
        [, lags (# | aic [#] | [#] | hqic [#])  ///
           regress bootstrap breps (#)         ///
           blevel(#) blength (#) seed(#) nodot ]
    

    2.2 选项

    • lags(#laic [#] | bic [#] | hqic [#]) 指出之后结构以执行回归计算统计量。默认滞后一阶,即 lags(1) 。
    • lags(#) 指定序列滞后阶数 # 需要在回归中应用。最大滞后阶数为 T>5+3*# 。
    • lags(#laic [#] | bic [#] | hqic [#]) 要求序列滞后阶数选择应根据回归设定最小的 AIC / BIC / HQIC 的平均。执行 1 阶至 # 阶滞后回归,将所有估计样本量限制为 T-#,使模型具有嵌套并具有可比性。显示的统计量来源于 AIC / BIC/ HQIC 平均值最小回归集。
    • regress 可用于显示基于的 N 个的回归的检验的结果。此选项有助于查看单个回归的系数。当面板中的样本数量足够大时,此选项的输出非常长。
    • bootstrap 按照 Dumitrescu 和 Hurlin(2012,sec.6.2) 的方法计算 P 值和临界值。 使用 bootstrap 能够克服数据中横截面存在依赖性。
      • breps (#) 表示 bootstrap 重复的次数,默认为 breps(1000)。
      • blevel (#) 表示 bootstrap 计算的临界值的显著性水平,默认为 blevel(95) 。
      • blength(#) 表示 bootstrap 的模块长度大小。默认每一时间段抽样独立且替代 blength(1) 。blength() 允许将样本划分为 # 时间段的重复块,并从中非替代独立抽样来完成 bootstrap 。如果怀疑存在自相关,则使用超过一个时间段是有用的。
      • seed(#) 用来设定随机数种子,默认为不设置。
      • nodots 抑制重复点,默认为每次重复就打印一个点,以指示 bootstrap 的演变。

    breps (), blevel () , blength (), seed () 以及 nodots 都是 bootstrap 的子选项。只有在 bootstrap 设定的情况下才能使用。

    2.3 结果的存储

    • xtgcause 存储在下述的 r() 标量中
    • r(wbar) 表示 Wald 统计量的平均值
    • r(zbart) 表示 Z-bar tilde 统计量
    • r(lags) 表示 检验的滞后阶数
    • z(bart_pv) 表示 Z-bar tilde 统计量的 P 值
    • r(zbar) 表示 Z-bar统计量
    • r(zbart_pv) 表示 Z-bar tilde 的 P 值
      Matrices
      r(Wi) 表示个体的 Wald 统计量,r(PVi) 表示个体的 Wald 统计量对应的 P 值

      使用 bootstrapxtgcause 也存储在下列 r() 标量中
    • r(zbarb_cv) 表示 Z-bar 统计量的临界值
    • r(blevel) 表示 bootstrap 临界值的显著性水平
    • r (zbartb_cv) 表示 Z-bar tilde 统计量的临界值
    • r(blength) 表示 block 长度的大小
    • r(breps) 表示 bootstrap的重复次数
    • r(ZBARb) 表示 bootstrap 产生的 Z-bar 统计量
    • r(ZBARTb) 表示 bootstrap 产生的 Z-bar tilde 统计量

    3. Stata 范例

    xtgcause 命令假定所有的变量都是平稳的。用 xtunitroot,可以提供多种面板稳定性检验。我们也可以用来进行二代单位根检验,例如 Pesaran 提出的控制横断面非独立性。

    3.1 基于模拟数据的例子

    为了解释说明 xtgcause,首先使用 Dumitrescu 和 Hurlin (2012) 提供的 [数据] 。可以直接从网站将数据导入 Stata。在原始 CSV 表格中,数据是矩阵形式,每一个样本的所有观测值都在同一个单元格中。在这个单元格中,变量 x 的 10 个值之间用空格分开, x 的最后一个值和 y 的第一个值用逗号隔开,然后变量 y 的 10 个值之间仍旧使用空格间隔。因此,下面几行命令以让 Stata 的了解数据结构,以进行转换。

    . insheet using "http://www.execandshare.org/execandshare/htdocs/data/MetaSite/upload/companionSite51/data/data-demo.csv", ///
       delimiter(",")  clear   //导入数据,生成 x 和 y ,每一个变量各包括 10 个值。
       **注意:对于 Stata 13.0 以上版本运行,还可以使用 import delimited  
    
    . split x, parse(`=char(9)') destring
    . split y, parse(`=char(9)') destring
    . drop x y
    . gen t = _n
    . reshape long x y, i(t) j(id)
    
    . xtset id t    //设定为面板数据
    
    . list id t x y in 2/7
    
         +----------------------------------+
         | id   t            x            y |
         |----------------------------------|
      2. |  2   1   -1.4703536    1.2586422 |
      3. |  3   1   -.38944513   -.90265296 |
      4. |  4   1    1.5032091    .09225216 |
      5. |  5   1   -1.2006193    .12203134 |
      6. |  6   1   -2.0245606    .93400482 |
         |----------------------------------|
      7. |  7   1    -.5433985   -.22942822 |
         +----------------------------------+
    

    xtgcause 的基本语法

    首先,我们使用 xtgcause 的默认情况进行操作(即使用滞后一阶,不设定更长的滞后阶数),在这种情况下,检验的结果为接受原假设。结果包括 w(w-bar) , z(z-bar tilde) 。对后两个统计量来说,还提供了就标准正态分布的 P 值。

    . xtgcause y x    //检验 x 是否导致了 y
    
    Dumitrescu & Hurlin (2012) Granger non-causality test results:
    --------------------------------------------------------------
    Lag order: 1
    W-bar =          1.2909
    Z-bar =          0.6504   (p-value = 0.5155)
    Z-bar tilde =    0.2590   (p-value = 0.7956)
    --------------------------------------------------------------
    H0: x does not Granger-cause y.
    H1: x does Granger-cause y for at least one panelvar (id).
    
    

    Wald 统计量

    也可以使用 Stata 的返回值 r(Wi)r(PVi) 展示 Wald 统计量和相关值(首先将其整合成一个简单矩阵以节省空间):

    matrix Wi_PVi = r(Wi), r(PVi)
    
    matrix list Wi_PVi
    
    Wi_PVi[10,2]
                 Wi        PVi
     id1  .56655945  .46256089
     id2  .11648998  .73731411
     id3  .09081952  .76701924
     id4  8.1263612  .01156476
     id5  .18687517  .67129995
     id6  .80060395  .38417583
     id7  .53075859  .47681675
     id8  .00158371  .96874825
     id9  .43635413   .5182858
    id10  2.0521113  .17124367
    
    

    设定滞后阶数

    使用 lags() 选项,可以进行 x 和 y 的二阶滞后检验,检验结果和之前类似。

    . xtgcause y x, lags(2)
    
    Dumitrescu & Hurlin (2012) Granger non-causality test results:
    --------------------------------------------------------------
    Lag order: 2
    W-bar =          1.7302
    Z-bar =         -0.4266   (p-value = 0.6696)
    Z-bar tilde =   -0.7052   (p-value = 0.4807)
    --------------------------------------------------------------
    H0: x does not Granger-cause y.
    H1: x does Granger-cause y for at least one panelvar (id).
    

    基于 Bootstrap 的标准误

    我们也可以使用 bootstrapped 计算 P 值和临界值,在这种情况下,bootstrapped 的 P 值和第一次检验中的渐进 P 值相近。

    . xtgcause y x, bootstrap lags(1) breps(100) seed(20190802)
    
    ----------------------------
    Bootstrap replications (100)
    ----------------------------
    ..................................................    50
    ..................................................   100
    
    Dumitrescu & Hurlin (2012) Granger non-causality test results:
    --------------------------------------------------------------
    Lag order: 1
    W-bar =          1.2909
    Z-bar =          0.6504   (p-value* = 0.5800, 95% critical value = 2.7526)
    Z-bar tilde =    0.2590   (p-value* = 0.8400, 95% critical value = 1.9042)
    --------------------------------------------------------------
    H0: x does not Granger-cause y.
    H1: x does Granger-cause y for at least one panelvar (id).
    *p-values computed using 100 bootstrap replications.
    

    3.2 现实数据的例子

    Paramati, Ummalla 和 Apergis (2016) 论文中使用的清洁能源的外国直接投资和股票市场增长率数据 为例,重现文章的结果分析。

    首先,将网站的数据下载,并导入Stata ,进行设定。需要说明的是,在使用 import excel 命令时,
    还可以增加 “case(preserve|lower|upper)” 选项来设置变量名的大小写。

    . import excel "Data.xlsx", clear first  ///
       cellrange(A1:J461) sheet(LN-EU) 
    
    . xtset ID Year
           panel variable:  ID (strongly balanced)
            time variable:  Year, 1993 to 2012
                    delta:  1 unit
    

    使用 xtgcause 来检验因果关系,和文中表 8 的结果一致。我们使用滞后 2 阶的数据和 Paramati, Ummalla 和 Apergis ( 2016 ) 中附录的数据匹配。和他们的结果相比,Eviews 中 Zbar-Stat 和 Z-bar tilde 统计量是一致的( Eviews 中不提供 Zbar )

    此外, xtgcause 可以自行设置滞后阶数,同时保证 AIC , BI , HQIC 最小化。Dumitrescu 和 Hurlin ( 2012 ) 并没有提供滞后阶数的选择,这就需要根据使用者经验判断。举例来说,我们可以通过 output fdi 设定滞后选项 lags(bic)

    事实上,xtgcause 可以进行滞后 1 阶至最高阶 T>5+3K 或者使用者自行设定限制值以下的回归。此外,如果 5 阶滞后都被考虑,面板中最初的 5 个观测值就不在估计中,即使滞后阶数可以比 5 少。 这确保了嵌套模型,然后可以使用 AIC ,BIC 或 HQIC 对其进行适当比较。 在这一系列估计之后,xtgcause 选择最佳结果(即,使得 N 个个体估计的平均 AIC / BIC / HQIC 最低)并且使用最佳滞后数并使用所有可用观察值重新运行所有估计。 对后者的统计数据报告为输出。

    在上面的例子中,使用 BIC 的最优滞后阶数 1 ,这与 Paramati , Ummalla 和 Apergis ( 2016 ) 为此检验选择的滞后顺序不同。这种差异可能会造成检验的结果是相反的。更确切地说,原假设不会因为最佳选择的单一滞后所拒绝,但 Paramati , Ummalla 和 Apergis ( 2016 ) 使用了两个滞后,因此拒绝零假设。 考虑到经济学中的实证研究被用于制定政策建议,这种不准确的结论可能是有害的。 因此,我们考虑使用 xtgcause 的选项,允许用户根据 AIC / BIC / HQIC 选择滞后数。 它将允许研究人员依赖这些广泛接受的标准清楚地选择。

    最后,xtgcause 通过 bootstrap 过程使得计算与 z-bar 和 z-bar tilde 相关的 P 值和临界值。计算 bootstrapped 临界值(而不是相似估计)可以非常有用当面板非独立。基于 Paramati, Ummalla 和 Apergis ( 2016 ) 数据,我们检验了因果关系从 output 到 fdi ,通过添加 bootstrap 选项(我们也为了replicability 使用 seed,节省空间使用nodots)。

    这里 xtgcause 首先使用前一系列估计中的最优滞后数来计算 Z-bar 和 Z-bar tilde 统计量; 然后,它计算了 bootstrapped 的 P 值和临界值。 默认情况下,每次形成 1000 次 bootstrap 重复。 我们观察到,与之前获得的渐近 P 值(从 0.34 到 0.45 )相比, Z-bar 的 bootstrapped的 P 值显着增加,而 Z-bar tilde的 P 值保持更接近。 这应该被解释为估计遭受小样本偏差的信号,因此低估了渐近 P 值。 Bootstrapped P 值表明零假设远未被拒绝,这加强了对 Paramati , Ummalla 和 Apergis ( 2016 ) 基于渐近 P 值并以两个滞后获得的结论的担忧。

    4. 结论

    在本文中,我们介绍了社区贡献的外部命令 xtgcause,该命令实现了 Dumitrescu 和 Hurlin(2012) 提出的面板数据 Granger 因果关系的检验。 xtgcause 命令的一个重要贡献是允许用户根据 AIC ,BIC 或 HQIC 选择滞后阶数。xtgcause 还可以计算 bootstrapped 临界值,以克服横截面的非独立。

    5. 参考文献

    • Berkowitz, J., and L. Kilian. 2000. Recent developments in bootstrapping time series. Econometric Reviews 19: 1- 48.
    • Breitung, J. 2000. The local power of some unit root tests for panel data. In Advances in Econometrics: Vol. 15——Nonstationary Panels, Panel Cointegration, and Dynamic Panels, ed. B. H. Baltagi, 161-178. New York: Elsevier.
    • Dumitrescu, E.-I., and C. Hurlin. 2012. Testing for Granger non-causality in heteroge­ neous panels. Economic Modelling 29: 1450-1460. [PDF]
    • Granger, C. W. J. 1969. Investigating causal relations by econometric models and cross-spectral methods. Econometrica 37: 424-438.
    • Hadri, K. 2000. Testing for stationarity in heterogeneous panel data. Econometrics Journal 3: 148-161. [PDF]
    • Harris, R. D. F., and E. Tzavalis. 1999. Inference for unit roots in dynamic panels where the time dimension is fixed. Journal of Econometrics 91: 201-226.
    • Im, K. S., M. H. Pesaran, and Y. Shin. 2003. Testing for unit roots in heterogeneous panels. Journal of Econometrics 115: 53-74.
    • Levin, A., C.-F. Lin, and C.-S. J. Chu. 2002. Unit root tests in panel data: Asymptotic and finite-sample properties. Journal of Econometrics 108: 1- 24.
    • Luciano Lopez, Sylvain Weber, 2017, Testing for Granger Causality in Panel Data, Stata Journal, 17(4): 972–984. [pdf]
    • Paramati, S. R., N. Apergis, and M. Ummalla. 2017. Financing clean energy projects through domestic and foreign capital: The role of political cooperation among the EU, the G20 and OECD countries. Energy Economics 61: 62- 71.
    • Paramati, S. R., M. Ummalla, and N. Apergis. 2016. The effect of foreign direct invest­ ment and stock market growth on clean energy use across a panel of emerging market economies. Energy Economics 56: 29- 41.
    • Pesaran, M. H. 2007. A simple panel unit root test in the presence of cross-section dependence. Journal of Applied Econometrics 22: 265- 312.
    • Salahuddin, M., K. Alam , and I. Ozturk. 2016. The effects of Internet usage and eco­ nomic growth on CO2 emissions in OECD countries: A panel investigation. Renewable and Sustainable Energy Reviews 62: 1226-1235.
    • Stine, R. A. 1987. Estimating properties of autoregressive forecasts. Journal of the American Statistical Association 82: 1072-1078.

    连享会计量方法专题……

    关于我们

    • 「Stata 连享会」 由中山大学连玉君老师团队创办,定期分享实证分析经验, 公众号:StataChina
    • 公众号推文同步发布于 CSDN简书知乎Stata专栏。可在百度中搜索关键词 「Stata连享会」查看往期推文。
    • 点击推文底部【阅读原文】可以查看推文中的链接并下载相关资料。
    • 欢迎赐稿: 欢迎赐稿。录用稿件达 三篇 以上,即可 免费 获得一期 Stata 现场培训资格。
    • E-mail: StataChina@163.com
    • 往期推文:计量专题 || 精品课程 || 简书推文 || 公众号合集

    点击查看完整推文列表


    欢迎加入Stata连享会(公众号: StataChina)

    展开全文
  • 论文研究-工程建设标准对我国经济增长影响的实证研究——基于协整理论、Granger因果检验和岭回归.pdf, 首先运用协整理论和Granger因果检验分析了工程建设标准和经济增长...
  • 运用Granger因果关系检验法,研究不同房地产市场发展阶段的地价与房价的互动关系。从地价与房价关系的作用机理出发,建立理论假设体系,以美国、日本、中国的时间序列数据为基础,进行实证研究。结果表明:在美国,...
  • 连享会—内生性专题—现场班随着面板数据库规模的扩大,围绕面板数据因果关系的理论也迅速发展。面板数据正从具有大样本量( N )和较短时间维度( T )的微观面板数据转变为到具有大样本量( N )和长的时间维度(T)的宏观...

    连享会—内生性专题—现场班

    adc678e475ee9088c9f57b4ed4a8f0a8.png

    随着面板数据库规模的扩大,围绕面板数据因果关系的理论也迅速发展。面板数据正从具有大样本量( N )和较短时间维度( T )的微观面板数据转变为到具有大样本量( N )和长的时间维度(T)的宏观面板数据。在这种情况下,就需要注意时间序列计量经济学的经典问题,即(非)平稳性和(非)因果关系。

    在本文中,我们介绍了社区贡献的外部命令  xtgcause ,它实现了 Dumitrescu 和 Hurlin (2012) 提出的面板数据中 Granger 因果关系的检验过程。

    xtgcause 通过最小化 Akaike 信息准则 (AIC)、贝叶斯信息准则 (BIC) 和 Hannan-Quinn 信息准则 (HQIC) 来选择模型中的滞后阶数,同时,它提供了 bootstrap 方法来计算 p 值和临界值。

    1. Dumitrescu-Hurlin 检验  (DH 检验)

    1.1 Granger 因果检验的基本思想

    Granger (1969) 开创性地提出一种分析时间序列数据因果关系的方法。

    假设 b5925b05-8933-eb11-8da9-e4434bdf6706.svgb6925b05-8933-eb11-8da9-e4434bdf6706.svg是两个平稳的序列,我们可以用如下模型来检验 x 是不是导致 y 变动的原因:

    8c589bf8c14f60c8c17b6fa5bc70c84e.png

    其基本思想在于,在控制 y 的滞后项 (过去值) 的情况下,如果 x 的滞后项仍然有助于解释 y 的当期值的变动,则认为 x 对 y 产生因果影响。

    检验的原假设为:

    b9925b05-8933-eb11-8da9-e4434bdf6706.svg

    这可以通过构造 F 统计量进行检验。如果 F 检验拒绝 ba925b05-8933-eb11-8da9-e4434bdf6706.svg ,则认为存在因果关系,即 x 是 y 的 Granger 因。显然,我们可以互换 x 和 y 的位置,以便检验 y 是否为 x 的 Granger 因。在很多情况下都会出现模型中所有变量之间都存在双向因果关系。

    1.2 Dumitrescu-Hurlin 的拓展

    Dumitrescu-Hurlin (2012) 在此基础上进行了拓展,提供了一个检验面板数据因果关系的方法。潜在的回归模型是:

    fa6896a6840bba7311cca6c661ddc415.png

    其中,bc925b05-8933-eb11-8da9-e4434bdf6706.svgbf925b05-8933-eb11-8da9-e4434bdf6706.svg。 c0925b05-8933-eb11-8da9-e4434bdf6706.svg 和 c2925b05-8933-eb11-8da9-e4434bdf6706.svg 是两个平稳序列在个体 i 和时间 t 上的观测值。

    DH 的面板因果检验允许每个截面单元的回归系数是可变的(即在同一时间上,系数在个体之间不同)。假设滞后阶数 k 对于所有个体是相同的,并且面板必须是平稳的。

    类似于 Granger 因果检验,DH 检验也是通过 x 的过去值对 y 的现值的影响来判断因果关系。

    检验统计量

    原假设认为面板中的所有个体都不存在因果关系,即:

    c4925b05-8933-eb11-8da9-e4434bdf6706.svg

    备择假设为部分(不是所有的)个体存在因果关系:

    a8a834485e7763e71c71ceeea17d3d0b.png

    其中,c7925b05-8933-eb11-8da9-e4434bdf6706.svg 是未知的。如果 cc925b05-8933-eb11-8da9-e4434bdf6706.svg ,则面板中的所有个体都存在因果关系。d0925b05-8933-eb11-8da9-e4434bdf6706.svg 必须严格小于 N 。

    实现方法

    在实际操作方面,DH 提出运行包含在 (1) 式中的 N 个独立回归,执行 k 个线性假设的 F 检验来获得 Wald 统计量 d4925b05-8933-eb11-8da9-e4434bdf6706.svg ,最后计算 Wald 统计量的平均值

    d9925b05-8933-eb11-8da9-e4434bdf6706.svg

    DH 检验的目的在探索面板数据的因果关系,拒绝 ba925b05-8933-eb11-8da9-e4434bdf6706.svg 并不排除一些个体的非因果关系。使用蒙特卡罗模拟(Monte Carlo Simulation), DH 发现 W 的渐进表现良好,可以用来检测面板因果关系。

    在 Wald 统计量 d4925b05-8933-eb11-8da9-e4434bdf6706.svg 是独立同分布的假设下,当 e8925b05-8933-eb11-8da9-e4434bdf6706.svg605687b4add21726cfba4460e7ba0823.png,标准化的统计 f4925b05-8933-eb11-8da9-e4434bdf6706.svg 服从下面的正态分布:

    7f427213e59888c47356d297ac059832.png

    而且,对一个 T>5+3K 的固定的 T 维度来说,最大标准统计量 Z 服从以下正态分布:

    6ff0e65a242304335a71515efdde65ae.png

    原假设 (3) 的检验也是基于 ff925b05-8933-eb11-8da9-e4434bdf6706.svgf4925b05-8933-eb11-8da9-e4434bdf6706.svg 。如果这些值大于标准化值,则拒绝原假设 ba925b05-8933-eb11-8da9-e4434bdf6706.svg,认为 Granger 因果存在。对 N 和 T 足够大的面板数据来说,使用 Z 统计量是合理的。对 N 足够大但 T 相对较小的面板数据而言,也可以使用 Z 统计量。对于 N 和 T 都很小的样本数据而言, DH 用蒙特卡洛推断说明了检验具有良好的样本性。

    滞后阶数的选取

    滞后阶数 k 的选择是一个经验问题,但是  Dumitrescu 和 Hurlin ( 2012 ) 并没有说明。解决这个问题的一个方法就是根据信息准则( AIC / BIC / HQIC )选择滞后阶数。在这个过程中,所有估计都要被嵌套在公共样本中执行、进而可以进行比较。事实上,这意味着 05935b05-8933-eb11-8da9-e4434bdf6706.svg 时间序列在整个滞后选择过程中被忽略掉了。另一个需要考虑的现实问题是面板数据中的横截面依赖性。为此,在 Dumitrescu 和 Hurlin ( 2012 ) 在 6.2 节中提出了一个计算 bootstrapped 临界值而不是渐进临界值:具体步骤为:

    1. 拟合模型 (2),根据(4)和(5)中的定义获得 ff925b05-8933-eb11-8da9-e4434bdf6706.svgf4925b05-8933-eb11-8da9-e4434bdf6706.svg

    2. faaba68346a290611c6fb8d0de819380.png  假设下拟合模型,得到残差矩阵 0d935b05-8933-eb11-8da9-e4434bdf6706.svg

    3. 重新抽取矩阵0e935b05-8933-eb11-8da9-e4434bdf6706.svg ,形成0d935b05-8933-eb11-8da9-e4434bdf6706.svg

    4. 随机抽取 14935b05-8933-eb11-8da9-e4434bdf6706.svg , 令 17935b05-8933-eb11-8da9-e4434bdf6706.svg ,其中 k 为可重复的连续时间序列 ;

    5. 根据 k 期随机抽取,构建 8e1977fad9ced4818fddde45e97474bc.png 重抽样序列;

    6. 拟合模型 081df348ce234924a02319d70fed5509.png,计算 1b935b05-8933-eb11-8da9-e4434bdf6706.svg1c935b05-8933-eb11-8da9-e4434bdf6706.svg

    7. 重复步骤 3-6 ;

    8. 根据 1b935b05-8933-eb11-8da9-e4434bdf6706.svg1c935b05-8933-eb11-8da9-e4434bdf6706.svg 的分布,计算 P 值、和 ff925b05-8933-eb11-8da9-e4434bdf6706.svgf4925b05-8933-eb11-8da9-e4434bdf6706.svg 的标准值。

    DH 的面板因果是允许每个截面单元的回归系数可变的,因此 Z 统计量也是多个 Z 的平均值,叫做 26935b05-8933-eb11-8da9-e4434bdf6706.svg  统计量。检验结果主要看最后一列相伴概率,可知所有变量都是双向因果的。

    2. xtgcasue 命令

    2.1 语法结构

    xtgcause depvar indepvar [if] [in] ///

    [, lags (# | aic [#] | [#] | hqic [#]) ///

    regress bootstrap breps (#) ///

    blevel(#) blength (#) seed(#) nodot ]

    2.2 选项

    • lags(#laic [#] | bic [#] | hqic [#]) 指出之后结构以执行回归计算统计量。默认滞后一阶,即 lags(1) 。

    • lags(#) 指定序列滞后阶数 # 需要在回归中应用。最大滞后阶数为 T>5+3*# 。

    • lags(#laic [#] | bic [#] | hqic [#]) 要求序列滞后阶数选择应根据回归设定最小的 AIC / BIC / HQIC 的平均。执行 1 阶至 # 阶滞后回归,将所有估计样本量限制为 T-#,使模型具有嵌套并具有可比性。显示的统计量来源于 AIC / BIC/ HQIC 平均值最小回归集。

    • regress 可用于显示基于的 N 个的回归的检验的结果。此选项有助于查看单个回归的系数。当面板中的样本数量足够大时,此选项的输出非常长。

    • bootstrap 按照 Dumitrescu 和 Hurlin(2012,sec.6.2) 的方法计算 P 值和临界值。使用 bootstrap 能够克服数据中横截面存在依赖性。

      • breps (#) 表示 bootstrap 重复的次数,默认为 breps(1000)。

      • blevel (#) 表示 bootstrap 计算的临界值的显著性水平,默认为 blevel(95) 。

      • blength(#) 表示 bootstrap 的模块长度大小。默认每一时间段抽样独立且替代 blength(1) 。blength() 允许将样本划分为 # 时间段的重复块,并从中非替代独立抽样来完成 bootstrap 。如果怀疑存在自相关,则使用超过一个时间段是有用的。

      • seed(#) 用来设定随机数种子,默认为不设置。

      • nodots 抑制重复点,默认为每次重复就打印一个点,以指示 bootstrap 的演变。

    breps (), blevel () , blength (), seed () 以及 nodots 都是 bootstrap 的子选项。只有在 bootstrap 设定的情况下才能使用。

    2.3 结果的存储

    • xtgcause 存储在下述的 r() 标量中

      • r(wbar)    表示 Wald 统计量的平均值r(zbart)    表示 Z-bar tilde 统计量  r(lags)    表示 检验的滞后阶数  z(bart_pv)    表示 Z-bar tilde 统计量的 P 值  r(zbar)    表示 Z-bar统计量  r(zbart_pv)    表示 Z-bar tilde 的 P 值Matricesr(Wi) 表示个体的 Wald 统计量,r(PVi) 表示个体的 Wald 统计量对应的 P 值
        使用 bootstrapxtgcause 也存储在下列 r() 标量中

    • r(zbarb_cv) 表示 Z-bar 统计量的临界值

    • r(blevel)  表示 bootstrap 临界值的显著性水平

    • r (zbartb_cv)   表示 Z-bar tilde 统计量的临界值

      • r(blength)    表示 block 长度的大小r(breps)     表示 bootstrap的重复次数

    • r(ZBARb)  表示 bootstrap 产生的 Z-bar 统计量

    • r(ZBARTb) 表示 bootstrap 产生的 Z-bar tilde 统计量

    3. Stata 范例

    xtgcause 命令假定所有的变量都是平稳的。用 xtunitroot,可以提供多种面板稳定性检验。我们也可以用来进行二代单位根检验,例如 Pesaran 提出的控制横断面非独立性。

    3.1 基于模拟数据的例子

    为了解释说明 xtgcause,首先使用 Dumitrescu 和 Hurlin (2012) 提供的 [数据] 。可以直接从网站将数据导入 Stata。在原始 CSV 表格中,数据是矩阵形式,每一个样本的所有观测值都在同一个单元格中。在这个单元格中,变量 x 的 10 个值之间用空格分开, x 的最后一个值和 y 的第一个值用逗号隔开,然后变量 y 的 10 个值之间仍旧使用空格间隔。因此,下面几行命令以让 Stata 的了解数据结构,以进行转换。

    . insheet using "http://www.execandshare.org/execandshare/htdocs/data/MetaSite/upload/companionSite51/data/data-demo.csv", ///

    delimiter(",") clear //导入数据,生成 x 和 y ,每一个变量各包括 10 个值。

    **注意:对于 Stata 13.0 以上版本运行,还可以使用 import delimited

    . split x, parse(`=char(9)') destring

    . split y, parse(`=char(9)') destring

    . drop x y

    . gen t = _n

    . reshape long x y, i(t) j(id)

    . xtset id t //设定为面板数据

    . list id t x y in 2/7

    +----------------------------------+

    | id t x y |

    |----------------------------------|

    2. | 2 1 -1.4703536 1.2586422 |

    3. | 3 1 -.38944513 -.90265296 |

    4. | 4 1 1.5032091 .09225216 |

    5. | 5 1 -1.2006193 .12203134 |

    6. | 6 1 -2.0245606 .93400482 |

    |----------------------------------|

    7. | 7 1 -.5433985 -.22942822 |

    +----------------------------------+

    xtgcause 的基本语法

    首先,我们使用 xtgcause 的默认情况进行操作(即使用滞后一阶,不设定更长的滞后阶数),在这种情况下,检验的结果为接受原假设。结果包括 w(w-bar) , z(z-bar tilde) 。对后两个统计量来说,还提供了就标准正态分布的 P 值。

    . xtgcause y x //检验 x 是否导致了 y

    Dumitrescu & Hurlin (2012) Granger non-causality test results:

    --------------------------------------------------------------

    Lag order: 1

    W-bar = 1.2909

    Z-bar = 0.6504 (p-value = 0.5155)

    Z-bar tilde = 0.2590 (p-value = 0.7956)

    --------------------------------------------------------------

    H0: x does not Granger-cause y.

    H1: x does Granger-cause y for at least one panelvar (id).

    Wald 统计量

    也可以使用 Stata 的返回值 r(Wi)r(PVi) 展示 Wald 统计量和相关值(首先将其整合成一个简单矩阵以节省空间):

    matrix Wi_PVi = r(Wi), r(PVi)

    matrix list Wi_PVi

    Wi_PVi[10,2]

    Wi PVi

    id1 .56655945 .46256089

    id2 .11648998 .73731411

    id3 .09081952 .76701924

    id4 8.1263612 .01156476

    id5 .18687517 .67129995

    id6 .80060395 .38417583

    id7 .53075859 .47681675

    id8 .00158371 .96874825

    id9 .43635413 .5182858

    id10 2.0521113 .17124367

    设定滞后阶数

    使用 lags() 选项,可以进行 x 和 y 的二阶滞后检验,检验结果和之前类似。

    . xtgcause y x, lags(2)

    Dumitrescu & Hurlin (2012) Granger non-causality test results:

    --------------------------------------------------------------

    Lag order: 2

    W-bar = 1.7302

    Z-bar = -0.4266 (p-value = 0.6696)

    Z-bar tilde = -0.7052 (p-value = 0.4807)

    --------------------------------------------------------------

    H0: x does not Granger-cause y.

    H1: x does Granger-cause y for at least one panelvar (id).

    基于 Bootstrap 的标准误

    我们也可以使用 bootstrapped 计算 P 值和临界值,在这种情况下,bootstrapped 的 P 值和第一次检验中的渐进 P 值相近。

    . xtgcause y x, bootstrap lags(1) breps(100) seed(20190802)

    ----------------------------

    Bootstrap replications (100)

    ----------------------------

    .................................................. 50

    .................................................. 100

    Dumitrescu & Hurlin (2012) Granger non-causality test results:

    --------------------------------------------------------------

    Lag order: 1

    W-bar = 1.2909

    Z-bar = 0.6504 (p-value* = 0.5800, 95% critical value = 2.7526)

    Z-bar tilde = 0.2590 (p-value* = 0.8400, 95% critical value = 1.9042)

    --------------------------------------------------------------

    H0: x does not Granger-cause y.

    H1: x does Granger-cause y for at least one panelvar (id).

    *p-values computed using 100 bootstrap replications.

    3.2 现实数据的例子

    以 Paramati, Ummalla 和 Apergis (2016) 论文中使用的清洁能源的外国直接投资和股票市场增长率数据 为例,重现文章的结果分析。

    首先,将网站的数据下载,并导入Stata ,进行设定。需要说明的是,在使用 import excel 命令时, 还可以增加 "case(preserve|lower|upper)" 选项来设置变量名的大小写。

    . import excel "Data.xlsx", clear first ///

    cellrange(A1:J461) sheet(LN-EU)

    . xtset ID Year

    panel variable: ID (strongly balanced)

    time variable: Year, 1993 to 2012

    delta: 1 unit

    使用 xtgcause 来检验因果关系,和文中表 8 的结果一致。我们使用滞后 2 阶的数据和 Paramati, Ummalla 和 Apergis ( 2016 ) 中附录的数据匹配。和他们的结果相比,Eviews 中 Zbar-Stat 和 Z-bar tilde 统计量是一致的( Eviews 中不提供 Zbar )

    此外, xtgcause 可以自行设置滞后阶数,同时保证 AIC , BI , HQIC 最小化。Dumitrescu 和 Hurlin ( 2012 ) 并没有提供滞后阶数的选择,这就需要根据使用者经验判断。举例来说,我们可以通过 output fdi 设定滞后选项 lags(bic)

    事实上,xtgcause 可以进行滞后 1 阶至最高阶 T>5+3K 或者使用者自行设定限制值以下的回归。此外,如果 5 阶滞后都被考虑,面板中最初的 5 个观测值就不在估计中,即使滞后阶数可以比 5 少。这确保了嵌套模型,然后可以使用 AIC ,BIC 或 HQIC 对其进行适当比较。在这一系列估计之后,xtgcause 选择最佳结果(即,使得 N 个个体估计的平均 AIC / BIC / HQIC 最低)并且使用最佳滞后数并使用所有可用观察值重新运行所有估计。对后者的统计数据报告为输出。

    在上面的例子中,使用 BIC 的最优滞后阶数 1 ,这与 Paramati , Ummalla 和 Apergis ( 2016 ) 为此检验选择的滞后顺序不同。这种差异可能会造成检验的结果是相反的。更确切地说,原假设不会因为最佳选择的单一滞后所拒绝,但 Paramati , Ummalla 和 Apergis ( 2016 ) 使用了两个滞后,因此拒绝零假设。考虑到经济学中的实证研究被用于制定政策建议,这种不准确的结论可能是有害的。因此,我们考虑使用 xtgcause 的选项,允许用户根据 AIC / BIC / HQIC 选择滞后数。它将允许研究人员依赖这些广泛接受的标准清楚地选择。

    最后,xtgcause 通过 bootstrap 过程使得计算与 z-bar  和 z-bar tilde 相关的 P 值和临界值。计算 bootstrapped 临界值(而不是相似估计)可以非常有用当面板非独立。基于 Paramati, Ummalla 和 Apergis ( 2016 ) 数据,我们检验了因果关系从 output 到 fdi ,通过添加 bootstrap 选项(我们也为了replicability 使用 seed,节省空间使用nodots)。

    这里 xtgcause 首先使用前一系列估计中的最优滞后数来计算 Z-bar 和 Z-bar tilde 统计量; 然后,它计算了 bootstrapped 的 P 值和临界值。默认情况下,每次形成 1000 次 bootstrap 重复。我们观察到,与之前获得的渐近 P 值(从 0.34 到 0.45 )相比, Z-bar 的 bootstrapped的 P 值显着增加,而 Z-bar tilde的 P 值保持更接近。这应该被解释为估计遭受小样本偏差的信号,因此低估了渐近 P 值。Bootstrapped P 值表明零假设远未被拒绝,这加强了对 Paramati , Ummalla 和 Apergis ( 2016 ) 基于渐近 P 值并以两个滞后获得的结论的担忧。

    4. 结论

    在本文中,我们介绍了社区贡献的外部命令 xtgcause,该命令实现了 Dumitrescu 和 Hurlin(2012) 提出的面板数据 Granger 因果关系的检验。 xtgcause 命令的一个重要贡献是允许用户根据 AIC ,BIC 或 HQIC 选择滞后阶数。xtgcause 还可以计算 bootstrapped 临界值,以克服横截面的非独立。

    5. 参考文献

    • Berkowitz, J., and L. Kilian. 2000. Recent developments in bootstrapping time series. Econometric Reviews 19: 1- 48.

    • Breitung, J. 2000. The  local  power  of some unit  root  tests for  panel data.  In Advances in Econometrics: Vol. 15——Nonstationary Panels, Panel Cointegration, and Dynamic Panels, ed. B. H. Baltagi, 161-178. New York: Elsevier.

    • Dumitrescu, E.-I., and C. Hurlin. 2012. Testing for Granger non-causality in heteroge­ neous panels. Economic Modelling 29: 1450-1460. [PDF]

    • Granger, C. W. J. 1969. Investigating causal relations by econometric models and cross-spectral methods. Econometrica 37: 424-438.

    • Hadri, K. 2000. Testing for stationarity in heterogeneous panel data. Econometrics Journal 3: 148-161. [PDF]

    • Harris, R. D. F., and E. Tzavalis. 1999. Inference for unit roots in dynamic  panels where the time dimension is fixed. Journal of Econometrics 91: 201-226.

    • Im, K. S., M. H. Pesaran, and Y. Shin. 2003. Testing for unit roots in heterogeneous panels. Journal of Econometrics 115: 53-74.

    • Levin, A., C.-F. Lin, and C.-S. J. Chu. 2002. Unit  root  tests in  panel data:  Asymptotic and finite-sample properties. Journal of Econometrics 108: 1- 24.

    • Luciano Lopez,  Sylvain Weber, 2017, Testing for Granger Causality in Panel Data, Stata Journal, 17(4): 972–984. [pdf]

    • Paramati, S. R., N. Apergis, and M. Ummalla. 2017. Financing clean energy projects through domestic and foreign capital: The  role  of  political  cooperation  among  the EU, the G20 and OECD countries. Energy Economics 61: 62- 71.

    • Paramati, S. R., M. Ummalla, and N. Apergis. 2016. The effect of foreign direct invest­ ment and stock market growth on clean energy use across a panel of emerging market economies. Energy Economics 56: 29- 41.

    • Pesaran, M. H. 2007. A simple panel unit root test in the presence of cross-section dependence. Journal of Applied Econometrics 22: 265- 312.

    • Salahuddin, M., K. Alam , and I. Ozturk. 2016. The effects of Internet usage and eco­ nomic growth on CO2 emissions in OECD countries: A panel investigation. Renewable and Sustainable Energy Reviews 62: 1226-1235.

    • Stine, R. A. 1987. Estimating properties of autoregressive forecasts. Journal of the American Statistical Association 82: 1072-1078. 

    展开全文
  • 运用计量经济学基本手段,设立相关模型,对我国消费者信心指数和股票市场收益率进行了单位根检验granger因果分析、VAR回归分析。得出我国消费者信心指数granger因果影响股票市场的收益率,而滞后的股市收益率和...
  • 基于异质信念下证券定价模型的分析,用投资者的资金流向作为异质信念的代理指标进行实证研究,发现投资者的异质性信念是造成短期证券价格波动的重要原因,并且证券价格波动作为市场信息通过强化和更新投资者信念进行...
  • 分位数Granger因果检验实现原理

    千次阅读 2020-04-11 12:59:25
    Sup-Wald检验量为: sup⁡WT=sup⁡i=1,⋯ ,nWT(τi)\sup W_{T}=\sup _{i=1, \cdots, n} W_{T\left(\tau_{i}\right)} supWT​=i=1,⋯,nsup​WT(τi​)​ Python在进行分位数回归时,方差默认为核估计 分位数方差核...

    各变量含义

    待估计方程:
    Q Y t [ τ ∣ Z t − 1 ] = a ( τ ) + Y t − 1 , p ′ α ( τ ) + X t − 1 , q ′ β ( τ ) = Z t − 1 ′ θ ( τ ) Q_{Y_{t}}\left[\tau | Z_{t-1}\right]=a(\tau)+Y_{t-1, p}^{\prime} \alpha(\tau)+X_{t-1, q}^{\prime} \beta(\tau)=Z_{t-1}^{\prime} \theta(\tau) QYt[τZt1]=a(τ)+Yt1,pα(τ)+Xt1,qβ(τ)=Zt1θ(τ)
    其中, a ( τ ) a(\tau) a(τ)为截距项, α ( τ ) \alpha(\tau) α(τ) β ( τ ) \beta(\tau) β(τ)为回归系数列向量; θ ( τ ) \theta(\tau) θ(τ)为回归系数向量,
    a ( τ ) = [ a l p h a ( τ ) , α ( τ ) ′ , β ( τ ) ′ ] ′ ​ a(\tau)=\left[alpha(\tau), \alpha(\tau)^{\prime}, \beta(\tau)^{\prime}\right]^{\prime}​ a(τ)=[alpha(τ),α(τ),β(τ)]

    Y t − 1 , p ′ = ( Y t − 1 , ⋯   , Y t − p ) \quad Y_{t-1, p}^{\prime}=\left(Y_{t-1}, \cdots, Y_{t-p}\right) Yt1,p=(Yt1,,Ytp)

    X t − 1 , q ′ = ( X t − 1 , ⋯   , X t − q ) \quad X_{t-1, q}^{\prime}=\left(X_{t-1}, \cdots, X_{t-q}\right) Xt1,q=(Xt1,,Xtq)

    Z t − 1 ′ = ( Y t − 1 , p ′ , X t − 1 , q ′ ) Z_{t-1}^{\prime}=\left(Y_{t-1, p}^{\prime}, X_{t-1, q}^{\prime}\right) Zt1=(Yt1,p,Xt1,q)

    Wald检验量为: W T ( τ ) = T β ^ ( τ ) ′ Σ ^ ( τ ) − 1 β ^ ( τ ) τ ( 1 − τ ) \mathrm{W}_{T}(\tau)=T \frac{\hat{\beta}(\tau)^{\prime} \hat{\Sigma}(\tau)^{-1} \hat{\beta}(\tau)}{\tau(1-\tau)} WT(τ)=Tτ(1τ)β^(τ)Σ^(τ)1β^(τ)

    Sup-Wald检验量为: sup ⁡ W T = sup ⁡ i = 1 , ⋯   , n W T ( τ i ) \sup W_{T}=\sup _{i=1, \cdots, n} W_{T\left(\tau_{i}\right)} supWT=i=1,,nsupWT(τi)

    Python在进行分位数回归时,方差默认为核估计

    分位数方差核密度估计原理(基于Eviews帮助文件)

    独立但不同分布假设下的参数渐近分布

    当分位数密度函数独立但不同分布即与解释变量X相关时, T ( β ^ ( τ ) − β ( τ ) ) \sqrt{T}(\hat{\beta}(\tau)-\beta(\tau)) T (β^(τ)β(τ))的渐近分布服从Huber sandwich形式:

    T ( β ^ ( τ ) − β ( τ ) ) ∼ N ( 0 , τ ( 1 − τ ) H ( τ ) − 1 J H ( τ ) − 1 ) ​ \sqrt{T}\left(\hat{\beta}_{(\tau)}-\beta_{(\tau)}\right){\sim} N\left(0, \tau(1-\tau) H(\tau)^{-1} J H(\tau)^{-1}\right)​ T (β^(τ)β(τ))N(0,τ(1τ)H(τ)1JH(τ)1)
    其中 T T T为样本容量, τ \tau τ为分位点, β ^ ( τ ) \hat{\beta}_{(\tau)} β^(τ) τ \tau τ分位点下回归系数估计量, N N N为正态分布, X i X_{i} Xi为解释变量矩阵;
    J = lim ⁡ n → ∞ ( ∑ i X i X i ′ T ) = lim ⁡ n → ∞ ( X X T ) ​ J=\lim _{n \rightarrow \infty}\left(\sum_{i} \frac{X_{i} X_{i}^{\prime}}{T}\right)=\lim _{n \rightarrow \infty}\left(\frac{X X}{T}\right)​ J=nlim(iTXiXi)=nlim(TXX)

    H ( τ ) = lim ⁡ T → ∞ ( ∑ i X i X i ′ f i ( q i ( τ ) ) / T ) H(\tau)=\lim _{T \rightarrow \infty}\left(\sum_{i} X_{i} X_{i}^{\prime} f_{i}\left(q_{i}(\tau)\right) / T\right) H(τ)=Tlim(iXiXifi(qi(τ))/T)

    f i ( q i ( τ ) ) f_{i}\left(q_{i}(\tau)\right) fi(qi(τ))是个体 i i i τ \tau τ分位点上的条件密度函数。使用核密度进行估计:
    H ^ ( τ ) = ( 1 / T ) ∑ i = 1 T c T − 1 K ( u ^ ( τ ) t / c T ) X i X i ′ \hat{H}(\tau)=(1 / T) \sum_{i=1}^{T} c_{T}^{-1} K\left(\hat{u}_{(\tau) t} / c_{T}\right) X_{i} X_{i}^{\prime} H^(τ)=(1/T)i=1TcT1K(u^(τ)t/cT)XiXi
    其中 u ^ ( τ ) i \hat{\mathcal{u}}_{(\tau) i} u^(τ)i表示分位数回归的残差; c T c_T cT为带宽,估计原理见下文;表示 κ \kappa κ核密度函数。EViews中可以选择的核密度函数有Epanechnikov核函数(默认)、均匀 (Uniform) 核函数、三角(Triangular)核函数、二权(Biweight)核函数、三权(Triweight)核函数、正态(Normal)核函数、余弦(Cosinus)核函数,具体函数形式见图。

    image-20200331180810735

    image-20200331181950284

    c T c_T cT的估计原理: c T = κ ( Φ − 1 ( τ + h n ) − Φ − 1 ( τ − h n ) ) c_{T}=\kappa\left(\Phi^{-1}\left(\tau+h_{n}\right)-\Phi^{-1}\left(\tau-h_{n}\right)\right) cT=κ(Φ1(τ+hn)Φ1(τhn))

    其中 κ = min ⁡ ( s , I Q R / 1.34 ) \kappa=\min (s, I Q R / 1.34) κ=min(s,IQR/1.34), I Q R IQR IQR为四分位距, I Q R = Q 3 − Q 1 \mathrm{I} Q \mathrm{R}=Q_{3}-Q_{1} IQR=Q3Q1; s s s为残差的标准差; h n h_n hn是Siddiqui带宽,
    h n = T − 1 / 3 Z α 2 / 3 ( 1.5 ( φ ( Φ − 1 ( τ ) ) ) 2 2 ( Φ − 1 ( τ ) ) 2 + 1 ) 1 / 3 h_{n}=T^{-1 / 3} Z_{\alpha}^{2 / 3}\left(\frac{1.5\left(\varphi\left(\Phi^{-1}(\tau)\right)\right)^{2}}{2\left(\Phi^{-1}(\tau)\right)^{2}+1}\right)^{1 / 3} hn=T1/3Zα2/3(2(Φ1(τ))2+11.5(φ(Φ1(τ)))2)1/3
    Φ \Phi Φ表示正态分布的积累分布函数, Φ − 1 \Phi^{-1} Φ1表示正态分布的逆函数, φ \varphi φ表示正态分布的密度函数, Z α = Φ − 1 ( 1 − α / 2 ) Z_{\alpha}=\Phi^{-1}(1-\alpha / 2) Zα=Φ1(1α/2)为选择的显著性水平 α \alpha α对应的 Z Z Z值。

    文中只列出一种方差的估计原理,更多内容详见Eviews 8帮助文件

    展开全文

空空如也

空空如也

1 2 3 4 5 ... 17
收藏数 333
精华内容 133
关键字:

granger因果检验