精华内容
下载资源
问答
  • 2020-12-22 17:23:44

    面板数据分析方法步骤全解

    面板数据的分析方法或许我们已经了解许多了,

    但是到底有没有一个

    基本的步骤

    呢?那些步骤是必须的?这些都是我们在研究的过程中

    需要考虑的,而且又是很

    实在的问题。面板单位根检验如何进行?协

    整检验呢?什么情况下要进行模型的

    修正?面板模型回归形式的选

    择?如何更有效的进行回归?诸如此类的问题我们

    应该如何去分析

    并一一解决?以下是我近期对面板数据研究后做出的一个简要总

    ,

    和大家分享一下,也希望大家都进来讨论讨论。

    步骤一:分析数据的平稳性(单位根检验)

    按照正规程序,面板数据模型在回归前需检验数据的平稳性。李子奈

    曾指出,一些非平稳的经济时间序列往往表现出共同的变化趋势,

    些序列间本身不一定有直接的关联,此时,对这些数据进行回归

    ,

    尽管有较高的

    R

    平方,但其结果是没有任何实际意义的。这种情况称

    为称为虚假回归或伪回归

    (

    spurious regression

    )。他认为平稳的真正

    含义是:一个时间序列剔除了不变的均值(可视为截距)和时间趋势

    列的平稳性进行检验。而检验数据平稳性最常用的办法就是单位根检

    验。首先,

    我们可以先对面板序列绘制时序图,

    以粗略观测时序图中

    由各个观测值描出代表

    变量的折线是否含有趋势项和

    (

    )

    截距项

    ,

    从而为进一步的单位根检验的检验模式

    做准备。

    单位根检验方法的文献综述:在非平稳的面板数据渐进过程中

    evin

    以后,剩余的序列为零均值,同方差,即白噪声。

    因此单位根检验时

    有三种检验模式:既有趋势又有截距、只有截距、

    以上都无

    因此为了避免伪回归,确保估计结果的有效性

    ,

    我们必须对各面板序

    更多相关内容
  • 面板数据回归方法及案例
  • Panel Data Toolbox v2.0 是 MATLAB 的一个新包,其中包括估计面板数据分析的主要计量经济学方法的函数。 该软件包涵盖了标准的固定、组间和随机效应方法,这些方法经过扩展以允许工具变量以及空间面板数据规范。 ...
  • 截面数据转化成面板数据,宽面板数据转化成长面板数据stata转化代码,包括季度数据和年度数据转化成面板数据!我们从Wind以及EPS等数据库下载的数据很多都是短面板数据,但是stata实证却要求使用长面板数据,这时候...
  • 按照正规程序,面板数据模型在回归前需检验数据的平稳性。步骤一:分析数据的平稳性(单位根检验)按照正规程序,面板数据模型在回归前需检验数据的平稳性。李子奈曾指出,一些非平稳的经济时间序列往往表现出共同的...

    按照正规程序,面板数据模型在回归前需检验数据的平稳性。

    步骤一:分析数据的平稳性(单位根检验)

    按照正规程序,面板数据模型在回归前需检验数据的平稳性。李子奈曾指出,一些非平稳的经济时间序列往往表现出共同的变化趋势,而这些序列间本身不一定有直接的关联,此时,对这些数据进行回归,尽管有较高的R平方,但其结果是没有任何实际意义的。这种情况称为称为虚假回归或伪回归(spurious regression)。他认为平稳的真正含义是:一个时间序列剔除了不变的均值(可视为截距)和时间趋势以后,剩余的序列为零均值,同方差,即白噪声。因此单位根检验时有三种检验模式:既有趋势又有截距、只有截距、以上都无。

    因此为了避免伪回归,确保估计结果的有效性,我们必须对各面板序列的平稳性进行检验。而检验数据平稳性最常用的办法就是单位根检验。首先,我们可以先对面板序列绘制时序图,以粗略观测时序图中由各个观测值描出代表变量的折线是否含有趋势项和(或)截距项,从而为进一步的单位根检验的检验模式做准备。

    单位根检验方法的文献综述:在非平稳的面板数据渐进过程中,Levin andLin(1993) 很早就发现这些估计量的极限分布是高斯分布,这些结果也被应用在有异方差的面板数据中,并建立了对面板单位根进行检验的早期版本。后来经过Levin et al. (2002)的改进,提出了检验面板单位根的LLC 法。Levin et al. (2002) 指出,该方法允许不同截距和时间趋势,异方差和高阶序列相关,适合于中等维度(时间序列介于25~250 之间,截面数介于10~250 之间) 的面板单位根检验。Im et al. (1997) 还提出了检验面板单位根的IPS 法,但Breitung(2000) 发现IPS 法对限定性趋势的设定极为敏感,并提出了面板单位根检验的Breitung 法。Maddala and Wu(1999)又提出了ADF-Fisher和PP-Fisher面板单位根检验方法。

    由上述综述可知,可以使用LLC、IPS、Breintung、ADF-Fisher 和PP-Fisher5种方法进行面板单位根检验。

    其中LLC-T 、BR-T、IPS-W 、ADF-FCS、PP-FCS 、H-Z 分别指Levin, Lin & Chu t* 统计量、Breitung t 统计量、lm Pesaran & Shin W 统计量、ADF- Fisher Chi-square统计量、PP-Fisher Chi-square统计量、Hadri Z统计量,并且Levin, Lin & Chu t* 统计量、Breitung t统计量的原假设为存在普通的单位根过程,lm Pesaran & Shin W 统计量、ADF- Fisher Chi-square统计量、PP-Fisher Chi-square统计量的原假设为存在有效的单位根过程, Hadri Z统计量的检验原假设为不存在普通的单位根过程。

    有时,为了方便,只采用两种面板数据单位根检验方法,即相同根单位根检验LLC(Levin-Lin-Chu)检验和不同根单位根检验Fisher-ADF检验(注:对普通序列(非面板序列)的单位根检验方法则常用ADF检验),如果在两种检验中均拒绝存在单位根的原假设则我们说此序列是平稳的,反之则不平稳。

    如果我们以T(trend)代表序列含趋势项,以I(intercept)代表序列含截距项,T&I代表两项都含,N(none)代表两项都不含,那么我们可以基于前面时序图得出的结论,在单位根检验中选择相应检验模式。

    但基于时序图得出的结论毕竟是粗略的,严格来说,那些检验结构均需一一检验。具体操作可以参照李子奈的说法:ADF检验是通过三个模型来完成,首先从含有截距和趋势项的模型开始,再检验只含截距项的模型,最后检验二者都不含的模型。并且认为,只有三个模型的检验结果都不能拒绝原假设时,我们才认为时间序列是非平稳的,而只要其中有一个模型的检验结果拒绝了零假设,就可认为时间序列是平稳的。

    此外,单位根检验一般是先从水平(level)序列开始检验起,如果存在单位根,则对该序列进行一阶差分后继续检验,若仍存在单位根,则进行二阶甚至高阶差分后检验,直至序列平稳为止。我们记I(0)为零阶单整,I(1)为一阶单整,依次类推,I(N)为N阶单整。

    步骤二:协整检验或模型修正

    情况一:如果基于单位根检验的结果发现变量之间是同阶单整的,那么我们可以进行协整检验。协整检验是考察变量间长期均衡关系的方法。所谓的协整是指若两个或多个非平稳的变量序列,其某个线性组合后的序列呈平稳性。此时我们称这些变量序列间有协整关系存在。因此协整的要求或前提是同阶单整。

    但也有如下的宽限说法:如果变量个数多于两个,即解释变量个数多于一个,被解释变量的单整阶数不能高于任何一个解释变量的单整阶数。另当解释变量的单整阶数高于被解释变量的单整阶数时,则必须至少有两个解释变量的单整阶数高于被解释变量的单整阶数。如果只含有两个解释变量,则两个变量的单整阶数应该相同。

    也就是说,单整阶数不同的两个或以上的非平稳序列如果一起进行协整检验,必然有某些低阶单整的,即波动相对高阶序列的波动甚微弱(有可能波动幅度也不同)的序列,对协整结果的影响不大,因此包不包含的重要性不大。而相对处于最高阶序列,由于其波动较大,对回归残差的平稳性带来极大的影响,所以如果协整是包含有某些高阶单整序列的话(但如果所有变量都是阶数相同的高阶,此时也被称作同阶单整,这样的话另当别论),一定不能将其纳入协整检验。

    协整检验方法的文献综述:(1)Kao(1999)、Kao and Chiang(2000)利用推广的DF和ADF检验提出了检验面板协整的方法,这种方法零假设是没有协整关系,并且利用静态面板回归的残差来构建统计量。(2)Pedron(1999)在零假设是在动态多元面板回归中没有协整关系的条件下给出了七种基于残差的面板协整检验方法。和Kao的方法不同的是,Pedroni的检验方法允许异质面板的存在。(3)Larsson et al(2001)发展了基于Johansen(1995)向量自回归的似然检验的面板协整检验方法,这种检验的方法是检验变量存在共同的协整的秩。

    主要采用的是Pedroni、Kao、Johansen的方法。

    通过了协整检验,说明变量之间存在着长期稳定的均衡关系,其方程回归残差是平稳的。因此可以在此基础上直接对原方程进行回归,此时的回归结果是较精确的。

    这时,我们或许还想进一步对面板数据做格兰杰因果检验(因果检验的前提是变量协整)。但如果变量之间不是协整(即非同阶单整)的话,是不能进行格兰杰因果检验的,不过此时可以先对数据进行处理。引用张晓峒的原话,“如果y和x不同阶,不能做格兰杰因果检验,但可通过差分序列或其他处理得到同阶单整序列,并且要看它们此时有无经济意义。”

    下面简要介绍一下因果检验的含义:这里的因果关系是从统计角度而言的,即是通过概率或者分布函数的角度体现出来的:在所有其它事件的发生情况固定不变的条件下,如果一个事件X的发生与不发生对于另一个事件Y的发生的概率(如果通过事件定义了随机变量那么也可以说分布函数)有影响,并且这两个事件在时间上又有先后顺序(A前B后),那么我们便可以说X是Y的原因。考虑最简单的形式,Granger检验是运用F-统计量来检验X的滞后值是否显著影响Y(在统计的意义下,且已经综合考虑了Y的滞后值;如果影响不显著,那么称X不是Y的“Granger原因”(Granger cause);如果影响显著,那么称X是Y的“Granger原因”。同样,这也可以用于检验Y是X的“原因”,检验Y的滞后值是否影响X(已经考虑了X的滞后对X自身的影响)。

    Eviews好像没有在POOL窗口中提供Granger causality test,而只有unit root test和cointegration test。说明Eviews是无法对面板数据序列做格兰杰检验的,格兰杰检验只能针对序列组做。也就是说格兰杰因果检验在Eviews中是针对普通的序列对(pairwise)而言的。你如果想对面板数据中的某些合成序列做因果检验的话,不妨先导出相关序列到一个组中(POOL窗口中的Proc/Make Group),再来试试。

    情况二:如果如果基于单位根检验的结果发现变量之间是非同阶单整的,即面板数据中有些序列平稳而有些序列不平稳,此时不能进行协整检验与直接对原序列进行回归。但此时也不要着急,我们可以在保持变量经济意义的前提下,对我们前面提出的模型进行修正,以消除数据不平稳对回归造成的不利影响。如差分某些序列,将基于时间频度的绝对数据变成时间频度下的变动数据或增长率数据。此时的研究转向新的模型,但要保证模型具有经济意义。因此一般不要对原序列进行二阶差分,因为对变动数据或增长率数据再进行差分,我们不好对其冠以经济解释。难道你称其为变动率的变动率?

    步骤三:面板模型的选择与回归

    面板数据模型的选择通常有三种形式:

    一种是混合估计模型(Pooled Regression Model)。如果从时间上看,不同个体之间不存在显著性差异;从截面上看,不同截面之间也不存在显著性差异,那么就可以直接把面板数据混合在一起用普通最小二乘法(OLS)估计参数。一种是固定效应模型(Fixed Effects Regression Model)。如果对于不同的截面或不同的时间序列,模型的截距不同,则可以采用在模型中添加虚拟变量的方法估计回归参数。一种是随机效应模型(Random Effects Regression Model)。如果固定效应模型中的截距项包括了截面随机误差项和时间随机误差项的平均效应,并且这两个随机误差项都服从正态分布,则固定效应模型就变成了随机效应模型。

    在面板数据模型形式的选择方法上,我们经常采用F检验决定选用混合模型还是固定效应模型,然后用Hausman检验确定应该建立随机效应模型还是固定效应模型。

    检验完毕后,我们也就知道该选用哪种模型了,然后我们就开始回归:

    在回归的时候,权数可以选择按截面加权(cross-section weights)的方式,对于横截面个数大于时序个数的情况更应如此,表示允许不同的截面存在异方差现象。估计方法采用PCSE(Panel Corrected Standard Errors,面板校正标准误)方法。Beck和Katz(1995)引入的PCSE估计方法是面板数据模型估计方法的一个创新,可以有效的处理复杂的面板误差结构,如同步相关,异方差,序列相关等,在样本量不够大时尤为有用。

    展开全文
  • 面板数据Pearson相关系数stata操作的代码
  • 论文研究-面板数据下的EG两步法.pdf, 针对文献中将时间序列模型的EG两步法直接应用到面板数据模型这一现象,推导了面板数据中使用EG两步法的极限分布,进而指出在面板...
  • 说明: 此压缩文件里面包含面板数据熵值法的stata代码,每一步都有详细的解释,并且附有样本和数据,方便学者理解和掌握。(This compressed file contains the stat a code of panel data entropy method, each step...
  • stata面板数据处理全过程代码 完全版 从检验到回归
  • 面板数据stata处理步骤介绍.pdf (288.3 KB) 很多不常用的方法步骤介绍——xtscc,xtivreg,xtivreg2等等等等,有它们的后续检验及筛选方法,还有修正方法(如fe的robust会损失一些效率;如何兼顾异方差和序列相关...
  • 面板数据聚类分析MATLAB代码
  • 步骤一:分析数据的平稳性(单位根检验)按照正规程序,面板数据模型在回归前需检验数据的平稳性。李子奈曾指出,一些非平稳的经济时间序列往往表现出共同的变化趋势,而这些序列间本身不一定有直接的关联,此时,对...

    步骤一:分析数据的平稳性(单位根检验)

    按照正规程序,面板数据模型在回归前需检验数据的平稳性。李子奈曾指出,一些非平稳的经济时间序列往往表现出共同的变化趋势,而这些序列间本身不一定有直接的关联,此时,对这些数据进行回归,尽管有较高的R平方,但其结果是没有任何实际意义的。这种情况称为称为虚假回归或伪回归(spurious regression)。他认为平稳的真正含义是:一个时间序列剔除了不变的均值(可视为截距)和时间趋势以后,剩余的序列为零均值,同方差,即白噪声。因此单位根检验时有三种检验模式:既有趋势又有截距、只有截距、以上都无。因此为了避免伪回归,确保估计结果的有效性,我们必须对各面板序列的平稳性进行检验。而检验数据平稳性最常用的办法就是单位根检验。首先,我们可以先对面板序列绘制时序图,以粗略观测时序图中由各个观测值描出代表变量的折线是否含有趋势项和(或)截距项,从而为进一步的单位根检验的检验模式做准备。单位根检验方法的文献综述:在非平稳的面板数据渐进过程中,Levin andLin(1993) 很早就发现这些估计量的极限分布是高斯分布,这些结果也被应用在有异方差的面板数据中,并建立了对面板单位根进行检验的早期版本。后来经过Levin et al. (2002)的改进,提出了检验面板单位根的LLC 法。Levin et al. (2002) 指出,该方法允许不同截距和时间趋势,异方差和高阶序列相关,适合于中等维度(时间序列介于25~250 之间,截面数介于10~250 之间) 的面板单位根检验。Im et al. (1997) 还提出了检验面板单位根的IPS 法,但Breitung(2000) 发现IPS 法对限定性趋势的设定极为敏感,并提出了面板单位根检验的Breitung 法。Maddala and Wu(1999)又提出了ADF-Fisher和PP-Fisher面板单位根检验方法。

    由上述综述可知,可以使用LLC、IPS、Breintung、ADF-Fisher 和PP-Fisher5种方法进行面板单位根检验。其中LLC-T 、BR-T、IPS-W 、ADF-FCS、PP-FCS 、H-Z 分别指Levin, Lin & Chu t* 统计量、Breitung t 统计量、lm Pesaran & Shin W 统计量、ADF- Fisher Chi-square统计量、PP-Fisher Chi-square统计量、Hadri Z统计量,并且Levin, Lin & Chu t* 统计量、Breitung t统计量的原假设为存在普通的单位根过程,lm Pesaran & Shin W 统计量、ADF- Fisher Chi-square统计量、PP-Fisher Chi-square统计量的原假设为存在有效的单位根过程, Hadri Z统计量的检验原假设为不存在普通的单位根过程。有时,为了方便,只采用两种面板数据单位根检验方法,即相同根单位根检验LLC(Levin-Lin- Chu)检验和不同根单位根检验Fisher-ADF检验(注:对普通序列(非面板序列)的单位根检验方法则常用ADF检验),如果在两种检验中均拒绝存在单位根的原假设则我们说此序列是平稳的,反之则不平稳。如果我们以T(trend)代表序列含趋势项,以I(intercept)代表序列含截距项,T&I代表两项都含,N(none)代表两项都不含,那么我们可以基于前面时序图得出的结论,在单位根检验中选择相应检验模式。但基于时序图得出的结论毕竟是粗略的,严格来说,那些检验结构均需一一检验。具体操作可以参照李子奈的说法:ADF检验是通过三个模型来完成,首先从含有截距和趋势项的模型开始,再检验只含截距项的模型,最后检验二者都不含的模型。并且认为,只有三个模型的检验结果都不能拒绝原假设时,我们才认为时间序列是非平稳的,而只要其中有一个模型的检验结果拒绝了零假设,就可认为时间序列是平稳的。此外,单位根检验一般是先从水平(level)序列开始检验起,如果存在单位根,则对该序列进行一阶差分后继续检验,若仍存在单位根,则进行二阶甚至高阶差分后检验,直至序列平稳为止。我们记I(0)为零阶单整,I(1)为一阶单整,依次类推,I(N)为N阶单整。

    步骤二:协整检验或模型修正

    情况一:如果基于单位根检验的结果发现变量之间是同阶单整的,那么我们可以进行协整检验。协整检验是考察变量间长期均衡关系的方法。所谓的协整是指若两个或多个非平稳的变量序列,其某个线性组合后的序列呈平稳性。此时我们称这些变量序列间有协整关系存在。因此协整的要求或前提是同阶单整。但也有如下的宽限说法:如果变量个数多于两个,即解释变量个数多于一个,被解释变量的单整阶数不能高于任何一个解释变量的单整阶数。另当解释变量的单整阶数高于被解释变量的单整阶数时,则必须至少有两个解释变量的单整阶数高于被解释变量的单整阶数。如果只含有两个解释变量,则两个变量的单整阶数应该相同。也就是说,单整阶数不同的两个或以上的非平稳序列如果一起进行协整检验,必然有某些低阶单整的,即波动相对高阶序列的波动甚微弱(有可能波动幅度也不同)的序列,对协整结果的影响不大,因此包不包含的重要性不大。而相对处于最高阶序列,由于其波动较大,对回归残差的平稳性带来极大的影响,所以如果协整是包含有某些高阶单整序列的话(但如果所有变量都是阶数相同的高阶,此时也被称作同阶单整,这样的话另当别论),一定不能将其纳入协整检验。

    协整检验方法的文献综述:(1)Kao(1999)、Kao and Chiang(2000)利用推广的DF和ADF检验提出了检验面板协整的方法,这种方法零假设是没有协整关系,并且利用静态面板回归的残差来构建统计量。(2)Pedron(1999)在零假设是在动态多元面板回归中没有协整关系的条件下给出了七种基于残差的面板协整检验方法。和Kao的方法不同的是,Pedroni的检验方法允许异质面板的存在。(3)Larsson et al(2001)发展了基于Johansen(1995)向量自回归的似然检验的面板协整检验方法,这种检验的方法是检验变量存在共同的协整的秩。我们主要采用的是Pedroni、Kao、Johansen的方法。通过了协整检验,说明变量之间存在着长期稳定的均衡关系,其方程回归残差是平稳的。因此可以在此基础上直接对原方程进行回归,此时的回归结果是较精确的。这时,我们或许还想进一步对面板数据做格兰杰因果检验(因果检验的前提是变量协整)。但如果变量之间不是协整(即非同阶单整)的话,是不能进行格兰杰因果检验的,不过此时可以先对数据进行处理。引用张晓峒的原话,“如果y和x不同阶,不能做格兰杰因果检验,但可通过差分序列或其他处理得到同阶单整序列,并且要看它们此时有无经济意义。” 下面简要介绍一下因果检验的含义:这里的因果关系是从统计角度而言的,即是通过概率或者分布函数的角度体现出来的:在所有其它事件的发生情况固定不变的条件下,如果一个事件X的发生与不发生对于另一个事件Y的发生的概率(如果通过事件定义了随机变量那么也可以说分布函数)有影响,并且这两个事件在时间上又有先后顺序(A前B后),那么我们便可以说X是Y的原因。考虑最简单的形式,Granger检验是运用F-统计量来检验X的滞后值是否显著影响Y(在统计的意义下,且已经综合考虑了Y的滞后值;如果影响不显著,那么称X不是Y的“Granger原因”(Granger cause);如果影响显著,那么称X是Y的“Granger原因”。同样,这也可以用于检验Y是X的“原因”,检验Y的滞后值是否影响X(已经考虑了X 的滞后对X自身的影响)。 Eviews好像没有在POOL窗口中提供Granger causality test,而只有unit root test和cointegration test。说明Eviews是无法对面板数据序列做格兰杰检验的,格兰杰检验只能针对序列组做。也就是说格兰杰因果检验在Eviews中是针对普通的序列对(pairwise)而言的。你如果想对面板数据中的某些合成序列做因果检验的话,不妨先导出相关序列到一个组中(POOL窗口中的Proc/Make Group),再来试试。

    情况二:如果如果基于单位根检验的结果发现变量之间是非同阶单整的,即面板数据中有些序列平稳而有些序列不平稳,此时不能进行协整检验与直接对原序列进行回归。但此时也不要着急,我们可以在保持变量经济意义的前提下,对我们前面提出的模型进行修正,以消除数据不平稳对回归造成的不利影响。如差分某些序列,将基于时间频度的绝对数据变成时间频度下的变动数据或增长率数据。此时的研究转向新的模型,但要保证模型具有经济意义。因此一般不要对原序列进行二阶差分,因为对变动数据或增长率数据再进行差分,我们不好对其冠以经济解释。难道你称其为变动率的变动率?

    步骤三:面板模型的选择与回归

    面板数据模型的选择通常有三种形式: 一种是混合估计模型(Pooled Regression Model)。如果从时间上看,不同个体之间不存在显著性差异;从截面上看,不同截面之间也不存在显著性差异,那么就可以直接把面板数据混合在一起用普通最小二乘法(OLS)估计参数。一种是固定效应模型(Fixed Effects Regression Model)。如果对于不同的截面或不同的时间序列,模型的截距不同,则可以采用在模型中添加虚拟变量的方法估计回归参数。一种是随机效应模型(Random Effects Regression Model)。如果固定效应模型中的截距项包括了截面随机误差项和时间随机误差项的平均效应,并且这两个随机误差项都服从正态分布,则固定效应模型就变成了随机效应模型。在面板数据模型形式的选择方法上,我们经常采用F检验决定选用混合模型还是固定效应模型,然后用Hausman检验确定应该建立随机效应模型还是固定效应模型。检验完毕后,我们也就知道该选用哪种模型了,然后我们就开始回归:在回归的时候,权数可以选择按截面加权(cross- section weights)的方式,对于横截面个数大于时序个数的情况更应如此,表示允许不同的截面存在异方差现象。估计方法采用PCSE(Panel Corrected Standard Errors,面板校正标准误)方法。Beck和Katz(1995)引入的PCSE估计方法是面板数据模型估计方法的一个创新,可以有效的处理复杂的面板误差结构,如同步相关,异方差,序列相关等,在样本量不够大时尤为有用。

    展开全文
  • 面板数据分析案例.pdf

    2021-10-11 03:04:03
    面板数据分析案例.pdf
  • 1999-2018年各地级市GDP\人数\教育水平。。。。等各类社会统计信息
  • 动态面板数据模型及Eviews实现 Eviews常用面板回归模型案例实战 Eviews写入面板数据② Eviews写入面板数据① 模型介绍 动态面板数据模型,即面板数据模型的解释项 中纳入 被解释变量 的滞后项,以反映动态滞后效应。...
  • 介绍面板数据的聚类分析,如何实现,及其原理。
  • 面板数据计量经济分析面板数据计量经济分析面板数据计量经济分析
  • 面板数据计量经济学(白仲林) 南开大学出版社
  • 【译】用python计量之面板数据模型雁陎•2020 年 06 月 25 日Loading...原文:[https://bashtage.github.io/linearmodels/panel/index.html](https://bashtage.github.io/linearmodels/panel/index.html)## 介绍...

    【译】用python做计量之面板数据模型

    雁陎 • 2020 年 06 月 25 日

    Loading...

    原文:[https://bashtage.github.io/linearmodels/panel/index.html](https://bashtage.github.io/linearmodels/panel/index.html)

    ## 介绍

    面板数据是具有时间序列(T)和截面(N)两个维度组织的数据。在面板数据的大多数经典应用中,观测的数量N大,而时间段的数量T小(通常在2到5之间)。这些估计量的渐近理论多是在N固定而T会发散的前提下得到的的。

    大多数面板模型旨在估计下面方程的参数:

    $$

    y_{i t}=x_{i t} \beta+\alpha_{i}+\epsilon_{i t}

    $$

    其中i为观测,t为时间,$\beta$包含了要估计的参数。$\alpha_i$是个体的异质性,无法观测。$\epsilon_{i t}$是特异性误差(idiosyncratic errors),与$\alpha_i$和$x_{it}$不相关。

    所有的模型都需要两个输入:

    * `dependent`,即因变量$y_{it}$

    * `exog`,即自变量$x_{it}$

    并使用不同的技术处理$\alpha_i$

    * [`PanelOLS`](https://bashtage.github.io/linearmodels/panel/panel/linearmodels.panel.model.PanelOLS.html#linearmodels.panel.model.PanelOLS "linearmodels.panel.model.PanelOLS")固定效应,即面板数据中随个体变化但不随时间变化的一类变量方法。这在数学上等价于为每个观测包含一个虚拟变量,尽管出于性能原因,实际上并不是这样实现的。

    * [`BetweenOLS`](https://bashtage.github.io/linearmodels/panel/panel/linearmodels.panel.model.BetweenOLS.html#linearmodels.panel.model.BetweenOLS "linearmodels.panel.model.BetweenOLS")平均数估计。即对面板数据的每个个体求平均数,然后利用自变量和因变量的N组观测值估计参数。

    * [`FirstDifferenceOLS`](https://bashtage.github.io/linearmodels/panel/panel/linearmodels.panel.model.FirstDifferenceOLS.html#linearmodels.panel.model.FirstDifferenceOLS "linearmodels.panel.model.FirstDifferenceOLS")一阶差分估计。即对个体固定效应模型中的回归量与被回归量的差分变量构成的模型的参数进行OLS估计。

    * [`RandomEffects`](https://bashtage.github.io/linearmodels/panel/panel/linearmodels.panel.model.RandomEffects.html#linearmodels.panel.model.RandomEffects "linearmodels.panel.model.RandomEffects")随机效应。当固定效应独立于回归变量时,RandomEffects 使用一个拟差分来有效地估计。 然而,当固定效应和回归变量之间存在依赖关系时,估计量就不再具有一致性。

    * [`PooledOLS`](https://bashtage.github.io/linearmodels/panel/panel/linearmodels.panel.model.PooledOLS.html#linearmodels.panel.model.PooledOLS "linearmodels.panel.model.PooledOLS")混合最小二乘估计。Pooledols 忽略了固定效应,当效应与回归因子无关时,它是一致的但是低效的。

    Panelols 比其他的估计方法更通用,可以用于两类效应的模型(例如,实体(即固定)和时间效应)

    > 模型中的$\alpha_i$,与回归自变量相关,称之为固定效应模型;与回归自变量不相关,称之为随机效应模型。

    >

    > 固定效应将α消掉,随机效应则将其放入误差项,然后探索方差结构。

    模型规范类似于 statsmodels。 下面例子估计了一个固定效应回归面板上的劳动者的工资,模型中劳动者的工资是经验平方的函数,如果一个男人结婚了虚拟变量设为1,如果这个男人是工会成员同样设定虚拟变量。

    ```python

    from linearmodels.panel import PanelOLS

    from linearmodels.datasets import wage_panel

    import statsmodels.api as sm

    data = wage_panel.load()

    data = data.set_index(['nr','year'])

    dependent = data.lwage

    exog = sm.add_constant(data[['expersq','married','union']])

    mod = PanelOLS(dependent, exog, entity_effects=True)

    res = mod.fit(cov_type='unadjusted')

    res

    ```

    结果:

    ```python

    PanelOLS Estimation Summary

    ================================================================================

    Dep. Variable: lwage R-squared: 0.1365

    Estimator: PanelOLS R-squared (Between): -0.0674

    No. Observations: 4360 R-squared (Within): 0.1365

    Date: Wed, Jun 24 2020 R-squared (Overall): 0.0270

    Time: 23:03:18 Log-likelihood -1439.0

    Cov. Estimator: Unadjusted

    F-statistic: 200.87

    Entities: 545 P-value 0.0000

    Avg Obs: 8.0000 Distribution: F(3,3812)

    Min Obs: 8.0000

    Max Obs: 8.0000 F-statistic (robust): 200.87

    P-value 0.0000

    Time periods: 8 Distribution: F(3,3812)

    Avg Obs: 545.00

    Min Obs: 545.00

    Max Obs: 545.00

    Parameter Estimates

    ==============================================================================

    Parameter Std. Err. T-stat P-value Lower CI Upper CI

    ------------------------------------------------------------------------------

    const 1.3953 0.0123 113.50 0.0000 1.3712 1.4194

    expersq 0.0037 0.0002 19.560 0.0000 0.0033 0.0041

    married 0.1073 0.0182 5.8992 0.0000 0.0717 0.1430

    union 0.0828 0.0198 4.1864 0.0000 0.0440 0.1215

    ==============================================================================

    F-test for Poolability: 9.3360

    P-value: 0.0000

    Distribution: F(544,3812)

    Included effects: Entity

    ```

    与statamodel类似,面板模型也可以使用类似 r 的公式来指定。 下面的模型和前面的一模一样。 注意使用特殊变量 EntityEffects 来包含固定效果。

    ```python

    mod = PanelOLS.from_formula('lwage ~ 1 + expersq + union + married + EntityEffects',data)

    ```

    ## 数据格式

    使用面板数据回归模型,需要以下的数据格式

    * 二维数据结构:MultiIndex DataFrames,其中外部索引是个体,内部索引是时间,可以使用pandas

    * 三维数据结构:3D structures,维度0是变量,维度1是个体索引,维度2是时间索引,还可以使用具有维度(t,n)的2D 数据结构,该数据结构被视为具有维度(1,t,n)的3D 数据结构。 这些3D数据结构可以是 pandas、 NumPy 或 xarray。

    > 因为本人习惯用pandas,所以就以pandas为例,其他numpy或者xarry自行去原文档查看。

    最精确的数据格式是MultiIndex DataFrame,因为只有单个列可以保留面板中的所有类型。

    下面示例使用培训数据,使用 set_index 命令构造 MultiIndex DataFrame。 个体索引为 fcode,时间索引为year。

    ```python

    from linearmodels.datasets import jobtraining

    data = jobtraining.load()

    print(data.head())

    mi_data = data.set_index(['fcode', 'year'])

    print(mi_data.head())

    ```

    ```python

    employ sales avgsal scrap rework tothrs union grant \

    fcode year

    410032 1987 100.0 47000000.0 35000.0 NaN NaN 12.0 0 0

    1988 131.0 43000000.0 37000.0 NaN NaN 8.0 0 0

    1989 123.0 49000000.0 39000.0 NaN NaN 8.0 0 0

    410440 1987 12.0 1560000.0 10500.0 NaN NaN 12.0 0 0

    1988 13.0 1970000.0 11000.0 NaN NaN 12.0 0 0

    d89 d88 ... grant_1 clscrap cgrant clemploy clsales \

    fcode year ...

    410032 1987 0 0 ... 0 NaN 0 NaN NaN

    1988 0 1 ... 0 NaN 0 0.270027 -0.088949

    1989 1 0 ... 0 NaN 0 -0.063013 0.130621

    410440 1987 0 0 ... 0 NaN 0 NaN NaN

    1988 0 1 ... 0 NaN 0 0.080043 0.233347

    lavgsal clavgsal cgrant_1 chrsemp clhrsemp

    fcode year

    410032 1987 10.463100 NaN NaN NaN NaN

    1988 10.518670 0.055570 0.0 -8.946565 -1.165385

    1989 10.571320 0.052644 0.0 0.198597 0.047832

    410440 1987 9.259130 NaN NaN NaN NaN

    1988 9.305651 0.046520 0.0 0.000000 0.000000

    [5 rows x 28 columns]

    ```

    当只引用单个序列时,可以使用 MultiIndex Series 表示形式。

    ```python

    from linearmodels import PanelOLS

    mod = PanelOLS(mi_data.lscrap, mi_data.hrsemp, entity_effects=True)

    print(mod.fit())

    ```

    ## 案例

    这些例子涵盖了可用于估计面板模型的模型。 最初的示例都忽略协方差选项,因此使用默认的经典协方差,该协方差适用于 homsedastic (同方差)数据。 备选的协方差选项将在本文档的末尾描述。

    ### 加载数据

    这些例子都利用了工资面板数据,参考文献

    > Vella and M. Verbeek (1998), “Whose Wages Do Unions Raise? A Dynamic Model of Unionism and Wage Rate Determination for Young Men,” Journal of Applied Econometrics 13, 163-183.

    这组数据包括20世纪80年代男性的工资和特征。 个体标识符为`nr`,标识的时间为`year`。 这些数据在 Jeffrey Wooldridge 的《计量经济学导论》第14章中得到了广泛的应用。同时,再添加一列`year`,方便添加时间虚拟变量。

    ```python

    from linearmodels.datasets import wage_panel

    import pandas as pd

    data = wage_panel.load()

    year = pd.Categorical(data.year)

    data = data.set_index(['nr', 'year'])

    data['year'] = year

    print(wage_panel.DESCR)

    print(data.head())

    ```

    ```python

    nr person identifier

    year 1980 to 1987

    black =1 if black

    exper labor market experience

    hisp =1 if Hispanic

    hours annual hours worked

    married =1 if married

    educ years of schooling

    union =1 if in union

    lwage log(wage)

    expersq exper^2

    occupation Occupation code

    ```

    ### 基本回归:混合回归

    仅仅是一个普通的 OLS,方便理解各种面板数据结构。 它作为一个基本模型是很有用的。 在这里,工资的对数被设定为因变量,该模型使用所有的变量和时间虚拟变量。

    ```python

    from linearmodels.panel import PooledOLS

    import statsmodels.api as sm

    exog_vars = ['black','hisp','exper','expersq','married', 'educ', 'union', 'year']

    exog = sm.add_constant(data[exog_vars])

    mod = PooledOLS(data.lwage, exog)

    pooled_res = mod.fit()

    print(pooled_res)

    ```

    ### 具有不相关效应的参数估计

    在对面板数据建模时,通常会考虑超出 OLS 有效估计范围的模型。最常见的是误差成分模型,它在标准OLS模型中增加了一个附加项,其中[Math Processing Error(数学处理误差)]影响个体i的所有数值,当[数学处理误差]与[数学处理误差]中的回归因子不相关时,可以使用随机效应模型来有效估计该模型的参数。

    #### 随机效应RE

    随机效应模型与混合OLS模型几乎相同,但它考虑到了模型的结构,因此效率更高。随机效应采用了一种quasi-demeaning策略,即减去个体内数值的时间平均数,以考虑到共同的冲击。

    ```python

    from linearmodels.panel import RandomEffects

    mod = RandomEffects(data.lwage, exog)

    re_res = mod.fit()

    print(re_res)

    ```

    模型的拟合度相当相似,尽管experience的回归发生了很大变化,其重要性也发生了变化。这在一定程度上是可以解释的,因为加入了年份虚拟变量,会拟合experience的趋势,所以只有横截面的差异才是重要的。随机效应估计器中的准差异取决于一个量,这个量取决于特异性冲击和共同冲击的相对方差。这可以使用`variance_decomposition`方法来访问。

    ```python

    re_res.variance_decomposition

    ```

    ```python

    Effects 0.106946

    Residual 0.123324

    Percent due to Effects 0.464438

    Name: Variance Decomposition, dtype: float64

    ```

    系数[数学处理误差]决定了demeaning发生的程度。当这个值为1时,RE模型就会还原为pooled模型,因为当effects没有方差时,就会出现这种情况。当面板不平衡时,它会在不同的实体之间变化,但在这个平衡的面板中,所有的值都是一样的。

    #### 平均数估计BE

    平均数估计是一种替代性的,通常效率较低的方法,可以用来估计模型参数。它特别简单,因为它首先计算[数学处理误差]和[数学处理误差]的时间平均数,然后用这些平均数进行简单的回归。

    剔除了年份虚拟变量,因为平均化消除了因年份而产生的差异。 expersq也被剔除,因为它与exper相当共线性。这些结果与前面的模型大致相似。

    ```python

    from linearmodels.panel import BetweenOLS

    exog_vars = ['black','hisp','exper','married', 'educ', 'union']

    exog = sm.add_constant(data[exog_vars])

    mod = BetweenOLS(data.lwage, exog)

    be_res = mod.fit()

    print(be_res)

    ```

    ### 具有相关效应的参数估计FE

    当效应与回归因子相关时,RE和BE估计量不一致。通常的解决方案是使用PanelOLS中的固定效应。固定效应应用于个体维度时称为实体效应,应用于时间维度时称为时间效应。

    #### 实体效应

    通过设置`entity_effects=True`参数,实体效应被包括在内。这相当于为每个个体加入了虚拟变量。在本面板中,这将增加545个虚拟变量,模型的估计速度将大大降低。PanelOLS实际上并没有使用虚拟变量,而是使用分组demeaning来达到同样的效果。

    时间不变变量:在使用实体效应时,不能包含时间变量,因为一旦demeaned,这些变量将全部为0。这里也不包括exper,因为一旦纳入实体效应和时间虚拟值,exper是完全共线性的。

    ```python

    from linearmodels.panel import PanelOLS

    exog_vars = ['expersq', 'union', 'married', 'year']

    exog = sm.add_constant(data[exog_vars])

    mod = PanelOLS(data.lwage, exog, entity_effects=True)

    fe_res = mod.fit()

    print(fe_res)

    ```

    #### 时间效应

    可以使用`time_effects=True`添加时间效应。这里去掉了时间虚拟变量。请注意,核心系数是相同的。唯一的变化是对集合性的检验统计,因为 "效应 "不同时包括实体和时间,而之前只包括实体。

    ```python

    exog_vars = ['expersq','union','married']

    exog = sm.add_constant(data[exog_vars])

    mod = PanelOLS(data.lwage, exog, entity_effects=True, time_effects=True)

    fe_te_res = mod.fit()

    print(fe_te_res)

    ```

    **效应VS虚拟变量**

    对于可以一致估计的变量,如通常的大N、固定T面板中的时间效应,没有必要将其作为效应列入。它们可以作为虚拟变量来实施。

    **其他选项**

    当使用PanelOLS和效应时,还有一些额外的选项可以使用。`use_lsdv`可以用来强制使用虚拟变量来估计模型。这不是必须的,而且在大多数情况下速度会比较慢。`auto_df`指示PanelOLS确定要进行的自由度调整。与大多数其他估计不同,效果的处理取决于协方差估计器。例如,当使用经典协方差估计器时,效应算作损失的自由度。当使用实体效应和按实体聚类时,则不会。设置`auto_df=False`将允许实体被计算或不计算,这取决于`count_effects`的值。

    #### 一阶差分

    在可能存在相关性的情况下,一阶差分是固定效应的一种替代方法。在使用一阶差分时,必须排除时间不变的变量。此外,只能包含一个线性时间趋势变量,因为它看起来像一个常数。这个变量将吸收数据中所有的时间趋势,因此对这些变量的解释可能是具有挑战性的。

    ```python

    from linearmodels.panel import FirstDifferenceOLS

    exog_vars = ['exper','expersq', 'union', 'married']

    exog = data[exog_vars]

    mod = FirstDifferenceOLS(data.lwage, exog)

    fd_res = mod.fit()

    print(fd_res)

    ```

    ### 比较模型

    模型结果可以使用`compare`进行比较。compare接受结果列表、结果字典,其中键被解释为模型名称。

    ```python

    from linearmodels.panel import compare

    print(compare({'BE':be_res,'RE':re_res,'Pooled':pooled_res}))

    ```

    ```python

    Model Comparison

    ===============================================================

    BE RE Pooled

    ---------------------------------------------------------------

    Dep. Variable lwage lwage lwage

    Estimator BetweenOLS RandomEffects PooledOLS

    No. Observations 545 4360 4360

    Cov. Est. Unadjusted Unadjusted Unadjusted

    R-squared 0.2155 0.1806 0.1893

    R-Squared (Within) 0.1141 0.1799 0.1692

    R-Squared (Between) 0.2155 0.1853 0.2066

    R-Squared (Overall) 0.1686 0.1828 0.1893

    F-statistic 24.633 68.409 72.459

    P-value (F-stat) 0.0000 0.0000 0.0000

    ===================== ============ =============== ============

    const 0.2836 0.0234 0.0921

    (1.5897) (0.1546) (1.1761)

    black -0.1414 -0.1394 -0.1392

    (-2.8915) (-2.9054) (-5.9049)

    hisp 0.0100 0.0217 0.0160

    (0.2355) (0.5078) (0.7703)

    exper 0.0278 0.1058 0.0672

    (2.4538) (6.8706) (4.9095)

    married 0.1416 0.0638 0.1083

    (3.4346) (3.8035) (6.8997)

    educ 0.0913 0.0919 0.0913

    (8.5159) (8.5744) (17.442)

    union 0.2587 0.1059 0.1825

    (5.6214) (5.9289) (10.635)

    expersq -0.0047 -0.0024

    (-6.8623) (-2.9413)

    year.1981 0.0404 0.0583

    (1.6362) (1.9214)

    year.1982 0.0309 0.0628

    (0.9519) (1.8900)

    year.1983 0.0202 0.0620

    (0.4840) (1.6915)

    year.1984 0.0430 0.0905

    (0.8350) (2.2566)

    year.1985 0.0577 0.1092

    (0.9383) (2.5200)

    year.1986 0.0918 0.1420

    (1.2834) (3.0580)

    year.1987 0.1348 0.1738

    (1.6504) (3.5165)

    ---------------------------------------------------------------

    T-stats reported in parentheses

    ```

    ### 协方差选项

    #### 异方差性稳健共方差

    Heteroskedasticity Robust Covariance

    White的稳健协方差可以通过设置`cov_type='robust'`来使用。这个估计器对某些类型的规范问题增加了一些稳健性,但在使用固定效应(实体效应)时不应使用,因为它不再是稳健的。取而代之的是需要一个聚类协方差。

    ```python

    exog_vars = ['black','hisp','exper','expersq','married', 'educ', 'union']

    exog = sm.add_constant(data[exog_vars])

    mod = PooledOLS(data.lwage, exog)

    robust = mod.fit(cov_type='robust')

    ```

    #### 按实体聚类

    通常要聚类的变量是实体或实体和时间。可以使用`cov_type='clusterered'`和附加关键字参数`cluster_entity=True`和/或`cluster_time=True`来实现。

    ```python

    clust_entity = mod.fit(cov_type='clustered', cluster_entity=True)

    clust_entity_time = mod.fit(cov_type='clustered', cluster_entity=True, cluster_time=True)

    ```

    `OrderedDict` 用于保存比较模型的结果。这允许对模型进行命名,也允许指定模型的顺序。一个标准的 dict 将产生有效的随机顺序。

    ```python

    from collections import OrderedDict

    res = OrderedDict()

    res['Robust'] = robust

    res['Entity'] = clust_entity

    res['Entity-Time'] = clust_entity_time

    print(compare(res))

    ```

    对实体的聚类降低了整个T统计量。这表明每个实体的残差有重要的相关性。按两者进行聚类也会降低t统计量,这表明数据中存在横截面依赖性。注:按实体聚类解决的是跨时间的相关性,按时间聚类控制的是一个时间段内实体之间的相关性。

    #### 其他聚类

    其他聚类可以用输入的聚类直接传递整数组(1列或2列,或1-d数组)。本例按职业进行聚类,由于只有9组,而且通常聚类标准误差的理论要求聚类的数量要大,所以可能不是一个可靠的变量。

    ```python

    clust_entity = mod.fit(cov_type='clustered', clusters=data.occupation)

    print(data.occupation.value_counts())

    print(clust_entity)

    ```

    ## 使用公式指定模型

    所有的模型都可以使用公式来指定,和statsmodels中的公式类似。单变量回归的基础公式语法为

    ```python

    y ~ 1 + x

    ```

    用于BetweenOLS、PooledOLS和RandomEffects的公式是完全标准的,与statsmodels相同。FirstDifferenceOLS几乎完全相同,但需要注意的是,该模型不能包含截距。

    实现效应(实体、时间或其他)的PanelOLS对公式有一个小的扩展,它允许将实体效应或时间效应(或两者)指定为公式的一部分。虽然不能使用公式接口指定其他效应,但在使用公式时,这些效应可以作为一个可选的参数包含在内。

    ### 加载数据

    使用公式时,需要一个MultiIndex pandas数据框架,其中的指数是实体时间。这里用statsmodels提供的 "企业投资的决定因素 "中的Grunfeld数据来说明公式的使用。这个数据集包含了企业投资、市场价值和工厂资本存量的数据。

    ```python

    from statsmodels.datasets import grunfeld

    data = grunfeld.load_pandas().data

    data = data.set_index(['firm','year'])

    print(data.head())

    ```

    ### 实体效应

    实体效果使用特殊命令EntityEffects来指定。默认情况下不包含常数,所以如果需要常数,应该在公式中包含1+。当包含效应时,无论是否包含常数,模型和拟合都是相同的。

    当一个常数被包含在模型中时,并施加额外的约束条件,即效应数为0,这样就可以使用因变量和回归变量的大平均数来确定常数。

    ```python

    from linearmodels import PanelOLS

    mod = PanelOLS.from_formula('invest ~ value + capital + EntityEffects', data=data)

    print(mod.fit())

    mod = PanelOLS.from_formula('invest ~ 1 + value + capital + EntityEffects', data=data)

    print(mod.fit())

    ```

    ### 实体和时间效应

    时间效应同样可以使用TimeEffect纳入。在许多模型中,时间效应可以被一致估计,因此它们可以等价地包含在使用分类变量的回归变量集中。

    ```python

    mod = PanelOLS.from_formula('invest ~ 1 + value + capital + EntityEffects + TimeEffects', data=data)

    print(mod.fit())

    ```

    ### 平均数估计

    其他的面板模型都是直截了当的,为了完整起见,将其包括在内。

    ```python

    from linearmodels import BetweenOLS, FirstDifferenceOLS, PooledOLS

    mod = BetweenOLS.from_formula('invest ~ 1 + value + capital', data=data)

    print(mod.fit())

    ```

    ### 一阶差分

    第一个差分模型绝对不能包含一个常数,因为这在差分后是无法确定的。

    ```python

    mod = FirstDifferenceOLS.from_formula('invest ~ value + capital', data=data)

    print(mod.fit())

    ```

    ### 混合回归

    混合OLS估计是PanelOLS在没有效应时的一种特殊情况。它与statsmodels(或WLS)中的OLS实际上是相同的,但为了完整起见,将其包括在内。

    ```python

    mod = PooledOLS.from_formula('invest ~ 1 + value + capital', data=data)

    print(mod.fit())

    ```

    展开全文
  • 面板数据一些面板数据教材面板数据分析美萧政著横截面与面板数据的经济计量分析伍德里奇著王忠玉译Baltagi.EconometricAnalysisofPanelData最新动态可关注期刊Journal
  • 省级统计年鉴
  • 对于面板数据, 首先给出面板数据的空间投射方法, 将面板数据投射为空间的向量序列. 然后, 基于空间向量的夹角和距离分别构建相似性和接近性关联度模型. 具体方法为: 利用向量夹角构建面板数据的相似性关联度模型; ...
  • stata命令:面板数据的中介效应、调节效应Stata操作演示
  • 中国335个地级市20年的面板数据,包括人口、财政等
  • stata时间序列数据( Time series data ),截面数据( Cross-sectional data )和面板数据( Panel data )的内生性检验
  • 在R语言中进行面板数据分析

    千次阅读 2020-12-23 02:34:54
    在R语言中进行面板数据分析面板数据(PanelData)是截面数据与时间序列数据综合起来的一种数据类型。它有时间序列和截面两个维度,当这类数据按两个维度排列时,是排在一个平面上,与只有一个维度的数据排在一条线上...
  • 动态门槛回归的相关资料,数据和程序,希望能够帮到有需要的同学
  • R语言-面板数据分析步骤及流程-

    千次阅读 2020-12-23 02:34:09
    面板数据分析步骤及流程-R语言2016年08月16日 16:49:55饭饭认认米阅读数 47093文章标签:r语言面板数据分析预测更多版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。面板...
  • 第16章Stata面板数据分析

    万次阅读 多人点赞 2021-08-09 12:09:16
    面板数据(Panel Data)又被称为平行数据,指的是对某变量在一定时间内持续跟踪观测的结果。面板数据间距了横截面数据和时间序列数据的特点,即有横截面维度(在同一时间段内有多个观测样本),又有时间序列维度...
  • 运用streamlit模块制作数据面板,包含工具栏以及主页面,将数据直观呈现。

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 233,588
精华内容 93,435
关键字:

如何做面板数据

友情链接: mpeg2cut.rar