-
2021-03-07 02:56:44
library(plm)
library(psych)
library(xts)
library(tseries)
library(lmtest)
## import dataset
datas
## adf test
pcgdp
adf.test(pcgdp)
# result: stationary
ltax
adf.test(ltax)
# result: stationary
hp
adf.test(hp)
# result: stationary
lp
adf.test(lp)
# result: stationary
## 协整检验
# Engle-Granger
reg
summary(reg)
error
adf.test(error)
# result: residuals stationary
### 面板数据回归
hpdatas
# Pooled Regression Model
hp_pool
# Fixed Effects Regression Model
hp_fe
# F-test :
pFtest(hp_fe,hp_pool)
# result: significant effects
# Random Effects Regression Model
hp_re
# Hausman test
phtest(hp_fe,hp_re)
# if p<0.05,then use fixed effects
# result: p=0.6785>0.05,use random ffects
# Random Effects Regression Model
hp_re
summary(hp_re)
# 显著水平 a=0.01
# result: fp:房价与 lp:地价正相关,且显著;
# fp:房价与 Ltax: 地税收入正相关,且显著;
# fp:房价与 PCGDP: 人均GDP 正相关,且显著;
更多相关内容 -
R语言面板数据篇(转)
2015-11-18 19:48:51面板数据 固定效应 个体效应 混合模型 应用手册 -
面板数据分析步骤及流程-R语言
2020-12-23 02:34:08面板数据面板数据(Panel Data),也成平行数据,...2、R语言操作数据格式,部分截图如下,这里以index3为因变量,index1与index2为解释变量: ##加载相关包install.packages("mice")##缺失值处理install.packages("pl...面板数据
面板数据(Panel Data),也成平行数据,具有时间序列和截面两个维度,整个表格排列起来像是一个面板。
面板数据举例:
模型说明及分析步骤
1、首先确定解释变量和因变量;
2、R语言操作数据格式,部分截图如下,这里以index3为因变量,index1与index2为解释变量:
##加载相关包
install.packages("mice")##缺失值处理
install.packages("plm")
install.packages("MSBVAR")
library(plm)
library(MSBVAR)
library(tseries)
library(xts)
library(mice)
data
2、单位根检验:数据平稳性
为避免伪回归,确保结果的有效性,需对数据进行平稳性判断。何为平稳,一般认为时间序列提出时间趋势和不变均值(截距)后,剩余序列为白噪声序列即零均值、同方差。常用的单位根检验的办法有LLC检验和不同单位根的Fisher-ADF检验,若两种检验均拒绝存在单位根的原假设则认为序列为平稳的,反之不平稳(对于水平序列,若非平稳,则对序列进行一阶差分,再进行后续检验,若仍存在单位根,则继续进行高阶差分,直至平稳,I(0)即为零阶单整,I(N)为N阶单整)。
##单位根检验
tlist1
adf.test(tlist1)
tlist2
adf.test(tlist2)
3、协整检验/模型修正
单位根检验之后,变量间是同阶单整,可进行协整检验,协整检验是用来考察变量间的长期均衡关系的方法。若通过协整检验,则说明变量间存在长期稳定的均衡关系,方程回归残差是平稳的,可进行回归。
格兰杰因果检验:前提是变量间同阶协整,通过条件概率用以判断变量间因果关系。
##格兰杰因果检验
granger.test(tsdata,p=2)
4、模型选择
面板数据模型的基本形式
也可写成:
其中:
对于平衡的面板数据,即在每一个截面单元上具有相同个数的观测值,模型样本观测数据的总数等于NT。
当N=1且T很大时,就是所熟悉的时间序列数据;当T=1而N很大时,就只有截面数据。
模型选择一般有三种形式
(1)无个体影响的不变系数模型(混合估计模型):ai=aj=a,bi=bj=b
即模型在横截面上无个体影响、无结构变化,可将模型简单地视为是横截面数据堆积的模型。这种模型与一般的回归模型无本质区别,只要随机扰动项服从经典基本假设条件,就可以采用OLS法进行估计(共有k+1个参数需要估计),该模型也被称为联合回归模型(pooled regression model)。
(2)变截距模型(固定效用模型):ai≠aj,bi=bj=b
即模型在横截面上存在个体影响,不存在结构性的变化,即解释变量的结构参数在不同横截面上是相同的,不同的只是截距项,个体影响可以用截距项ai (i=1,2,…,N)的差别来说明,故通常把它称为变截距模型。
(3)变系数模型(随机效应模型):ai≠aj,bi≠bj
即模型在横截面上存在个体影响,又存在结构变化,即在允许个体影响由变化的截距项ai (i=1,2,…,N)来说明的同时还允许系数向量bi (i=1,2,…,N)依个体成员的不同而变化,用以说明个体成员之间的结构变化。我们称该模型为变系数模型。
选择合适的面板模型
需要检验被解释变量yit的参数ai和bi是否对所有个体样本点和时间都是常数,即检验样本数据究竟属于上述3种情况的哪一种面板数据模型形式,从而避免模型设定的偏差,改进参数估计的有效性。
如果接受假设H2,则可以认为样本数据符合不变截距、不变系数模型。如果拒绝假设H2,则需检验假设H1。如果接受H1,则认为样本数据符合变截距、不变系数模型;反之,则认为样本数据符合变系数模型。
F检验
具体计算过程略,见参考ppt。
其中下标1,s1指代随机效应模型的残差平方和,s2指代固定效用模型残差平方和,s3指代混合估计模型的残差平方和;
若F2统计量的值小于给定显著水平下的相应临界值,即F2小于Fa,则接受H2,认为样本数据符合混合效应模型;反之,则继续检验假设H1;
若F1统计量的值小于给定显著水平下的相应临界值,即F1小于Fa,则接受H1,认为样本数据符合固定效应模型;反之,则认为样本数据符合随机效应模型;
随机效应模型
(1)1.LM检验。Breush和Pagan于1980年提出R 检验方法。
其检验原假设和备择假设:
如果不否定原假设,就意味着没有随机效应,应当采用固定效应模型。
(2). 豪斯曼(Hausman)检验。William H Greene于1997年提出了一种检验方法,称为豪斯曼(Hausman)检验。
若统计量大于给定显著水平下临界值,p值小于给定显著水平,则存在个体固定效应,应建立个体固定效应模型。
form
rankData
pool
pooltest(form,data=rankData,effect="individual",model="within")#检验个体间是否有差异
pooltest(form,data=rankData,effect="time",model="within")#检验不同时间是否有差异
wi
pooltest(pool,wi)#F检验判断混合模型与固定效应模型比较
phtest(form,data=rankData)##Hausman检验判断应该采用何种模型,随机效应模型检验
pbgtest(form,data=rankData,model="within")#LM检验,随机效应模型检验
#检验是否存在序列相关
pwartest(form,data=rankData)#Wooldridge检验(自相关)小于0.05存在序列相关
summary(wi)##查看拟合模型信息
fixef(wi,effect="time")#不同时间对因变量的影响程度的系数估计值
inter
##根据模型参数,进行预测;
注:有些地方,尤其R代码部分有些乱,需根据实际数据情况进行选择,函数的参数设置并未完全吃透,还需要继续学习,如有不对的地方,再改正,目前的理解是这样了,在本次数据场景中,实际数据应用中预测效果不是很好,误差稍大,这次未采用,以后遇到可以再尝试。
-
在R语言中进行面板数据分析
2020-12-23 02:34:54在R语言中进行面板数据分析面板数据(PanelData)是截面数据与时间序列数据综合起来的一种数据类型。它有时间序列和截面两个维度,当这类数据按两个维度排列时,是排在一个平面上,与只有一个维度的数据排在一条线上...在
R
语言中进行面板数据分析
面板数据
(
Panel Data
)
是截面数据与时间序列数据综合起来的一种数据类型。
它有时间序
列和截面两个维度,
当这类数据按两个维度排列时,
是排在一个平面上,
与只有一个维度的
数据排在一条线上有着明显的不同,整个表格像是一个面板
,
所以把
panel data
译作
“
面板数
据
”
。
面板数据模型的选择通常有三种形式:
第一种是混合估计模型(
Pooled Regression Model
)
。如果从时间上看,不同个体之间不存在
显著性差异;
从截面上看,
不同截面之间也不存在显著性差异,
那么就可以直接把面板数据
混合在一起用普通最小二乘法(
OLS
)估计参数。
第二种是固定效应模型
(
Fixed Effects Regression Model
)
。
如果对于不同的截面或不同的时间
序列,
模型的截距不同,
则可以采用在模型中添加虚拟变量的方法估计回归参数。
该模型刻
画了不同个体的特殊影响,而且这个影响不随样本变化。
第三种是随机效应模型(
Random Effects Regression Model
)
。如果固定效应模型中的截距项
包括了截面随机误差项和时间随机误差项的平均效应,
并且这两个随机误差项都服从正态分
布,
则固定效应模型就变成了随机效应模型。
该模型刻画了不同个体的特殊影响,
但这个影
响会随样本变化。
首先载入程序包和数据
library(plm)
将数据转成可处理的面板格式,特别要注意标明个体名和时间名
pgr
先用混合估计模型进行估计
gr_pool
, data = pgr,
model = "pooling")
再用固定效应模型进行估计
gr_fe
, data = pgr,
model = "within")
如果要判断固定效应模型是否比混合估计模型更好,可采用
F
检验
pFtest(gr_fe, gr_pool)
最后我们用随机效应模型进行估计
gr_re
, data = pgr,
model = "random", random.method = "swar")
summary(gr_re)
要判断随机效应模型是否与固定效应模型有区别,可采用
Hausman
检验
phtest(gr_re, gr_fe)
-
R语言分析面板数据:简单案例
2020-12-23 02:35:00R语言分析面板数据:简单案例标签:#R语言##面板数据#时间:2017/05/03 16:12:03作者:慕清雪1.面板数据定义面板数据,即Panel Data,也叫“平行数据”,是指在时间序列上取多个截面,在这些截面上同时选取样本观测...R语言分析面板数据:简单案例
标签:#R语言##面板数据#
时间:2017/05/03 16:12:03
作者:慕清雪
1.面板数据定义
面板数据,即Panel Data,也叫“平行数据”,是指在时间序列上取多个截面,在这些截面上同时选取样本观测值所构成的样本数据。或者说他是一个m*n的数据矩阵,记载的是n个时间节点上,m个对象的某一数据指标。(from 百度百科)
2.R语言中进行面板数据分析的包:plm
3.一个关于工资水平的案例
data set:美国595名个体从1976年到1982年的数据,共有4165个观测值(4165/595=7;相当于每个个体有7条记录)这七个观测值按顺序对应于1976到1982年的观测。数据来源:plm包里的Wages数据。
数据一览:

code:
```r
install.packages("plm")
library(plm)
data("Wages",package="plm")
rd=plm(lwage~married+exp+I(exp^2)+bluecol+union+sex+black+ed,data=Wages,model="random",index=595)
summary(rd)
```
结果一览:

上述回归没有添加工具变量,下面添加工具变量:sex,black,bluecol,south,smsa,ind
plm方法里添加工具变量的方法是使用"|","|"后的变量为工具变量
```r
library(plm)
data("Wages",package="plm")
ht=plm(lwage~married+exp+I(exp^2)+bluecol+union+sex+black+ed | sex+black+bluecol+south+smsa+ind,data=Wages,index=595)
summary(ht)
```
结果一览:

T.V.exo:外生变量(工具变量)
T.V.endo:内生变量
T.I.exo:不随时间变化的外生变量
T.I.endo:不随时间变化的内生变量
-
R语言-面板数据分析步骤及流程-
2020-12-23 02:34:09面板数据分析步骤及流程-R语言2016年08月16日 16:49:55饭饭认认米阅读数 47093文章标签:r语言面板数据分析预测更多版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。... -
R语言 函数与模型(10):面板门限回归模型
2020-12-23 02:34:12library(pdR)library(plm)library(plm)###读取数据,面板数据为中国大陆31个省级行政单位的财政相关数据,时间范围为2004年至2015年,共372行,14列。data=read.csv("trsp.csv",sep=",",head=T)trsp.data=plm.data... -
R语言1-面板数据分析全过程 附代码
2020-05-30 11:44:07R语言1-面板数据分析全过程 附代码 用途 面板数据常见于计量经济学领域,本质上是一种线性回归方法。截面数据和时间序列数据的组合可以更多的反应数据情况,同时也需要克服二者都存在的问题。 数据初步处理 在Excel... -
R语言 面板数据分析 plm包实现(三)——面板数据与面板模型的检验
2021-01-23 10:44:47本文针对面板数据主要有三种模型: 1. pool模型 2. 固定效应模型 3. 随机效应模型 介绍了数据检验和模型检验用R语言实现过程,包括F test, Hausman test和 LM test。承接系列一部分,在模型检验确定如何使用模型后... -
面板数据估计的R实现
2020-12-23 02:34:07###面板数据回归模型(模型估计,参数检验)####变截距模型> library(plm)> library(foreign)> examError in file(file, "rt") : cannot open the connectionIn addition: Warning message:In file(file, ... -
面板回归模型建模步骤(附R语言常用函数)
2020-10-30 21:33:37面板数据模型有三种形式:混合估计模型、固定效应模型和随机效应模型;对于混合估计模型,如果从时间上看,不同个体之间不存在显著性差异;从截面上看,不同截面之间也不存在显著性差异,可以直接把面板数据混合在... -
完整详细的回归分析实例R语言实现(含数据代码)
2019-10-06 14:17:01目录问题2.15(1)画散点图1.1问题求解1.1.1输入1.1.2输出(2)${x}$与$y$之间是否大致呈线性关系(3)用最小二乘估计求回归方程3.1问题分析3.2问题求解3.2.1输入3.2.2输出(4)求回归标准误差 $\hat\sigma$4.1问题分析4.2... -
R语言 面板数据分析 plm包实现(一) ——LSDV和固定效应模型
2020-11-02 19:50:18文本主要阐述了R语言中如何用plm包做面板数据分析,几种模型的具体实现。 包括pool模型,LSDV模型,组内模型(within),时间固定效应Panel模型 和个体和时间双维固定效应模型。 提供了一个数据集供读者以复现 -
实证操作:R语言实现分位数回归的介绍
2022-04-04 23:27:03“分位数回归是估计一组回归变量X与被解释变量Y的分位数之间线性关系的建模...这里以R里面分位数回归程序包(quantreg)自带的数据barro为例,来展示R语言如何进行分位数回归的操作。 library(quantreg)data -
工具&方法 | “名牌包”:面板、时间序列模型常用R语言包
2020-12-23 02:34:11R语言包,已经实现了现代计量经济学的很多统计分析功能,下面从面板数据模型和时间序列模型简要介绍R语言相关程序包:1.面板数据模型,Panel data models,23个包2.时间序列模型,Time series data and models,19个... -
拓端tecdat|R语言高维数据惩罚回归方法:主成分回归PCR、岭回归、lasso、弹性网络elastic net分析基因数据
2021-08-12 15:35:421 介绍 在本文中,我们将研究以下主题 ...这个数据集包含120个样本的200个基因的基因表达数据。这些数据来源于哺乳动物眼组织样本的微阵列实验。 该数据集由两个对象组成: genes: 一个120×200的矩... -
R语言1-面板数据分析全过程 附代码用途
2021-07-08 19:12:48R语言1-面板数据分析全过程 附代码 用途 面板数据常见于计量经济学领域,本质上是一种线性回归方法。截面数据和时间序列数据的组合可以更多的反应数据情况,同时也需要克服二者都存在的问题。 数据初步处理 在Excel... -
R语言实现PVAR(面板向量自回归模型)
2019-06-05 20:16:00这次研究了一个问题,要用PVAR(面板向量自回归模型),在网上找的教程基本上都是Stata或者Eviews的教程,而鲜有R实现PVAR的教程,这里总结分享一下我摸索的PVAR用R实现的整个过程。 ... -
拓端tecdat|R语言分段回归数据分析案例报告
2019-06-21 16:55:14原文:http://tecdat.cn/?p=3805 #读取数据 data=read.csv("artificial-cover.csv") #查看部分数据 head(data) ## tree.cover shurb.grass.cover ## 1 13.2 16.8 ## 2 17.2 2... -
拓端tecdat|R语言用线性回归模型预测空气质量臭氧数据
2020-02-22 23:52:48在这里,我将讨论使用空气质量数据集的普通最小二乘回归示例解释线性模型时最重要的方面。 空气质量数据集 空气质量数据集包含对在纽约获得的以下四个空气质量指标的154次测量: 臭氧:平均臭氧水平,以十亿分之... -
R语言:遍历文件&多元回归&股票数据
2019-06-17 00:22:20今天要呈现的是: 对2014年1月2日到2018年12月28日,5只股票进行多元回归分析。...股票数据是面板数据; 收益率不是直接给的; 能否遍历所有股票同时进行多元回归分析; R语言:遍历文件&多元回归&股票... -
拓端tecdat:R语言主成分回归(PCR)、 多元线性回归特征降维分析光谱数据和汽车油耗、性能数据
2021-11-04 18:05:51原文出处:拓端数据部落公众号 什么是PCR?(PCR = PCA + MLR) • PCR是处理许多 x 变量的回归技术 • 给定 Y 和 X 数据: • 在 X 矩阵上进行 PCA – 定义新变量:主成分(分数) • 在 多元线性回归(MLR) 中... -
STATA面板数据回归解读.ppt
2020-12-18 18:01:50STATA面板数据回归解读STATA在实证研究中的应用 刘永东 中国科学院农业政策研究中心 Outline STATA数据分析基础 软件名称 最新版本 安装文件大小 SAS 9.1.3 3G SPSS ... -
panelr:用于重复测量和面板数据的回归模型和实用程序
2021-02-05 14:47:33panelr:用于重复测量和面板数据的回归模型和实用程序