精华内容
下载资源
问答
  • 倾向得分匹配协变量
    千次阅读
    2021-07-11 13:22:01

    全文阅读:https://www.lianxh.cn/news/2da90377100cf.html

    目录

    倾向得分匹配分析 (PSM) 已经在诸多领域得到了应用。虽然 PSM 不能完全解决内生性问题,但却能在很大程度上缓解自我选择问题导致的偏差。在前期文献中,Becker & Ichino (2002, Stata Journal, 2(4):358-377) 对 PSM 的分析过程进行了详细的介绍,Stata 中也有多个命令可以执行 PSM 分析,如 pscorepsmatch2treatrew (Stata Journal, 14(3): 541-561), gpscore (SJ 8(3):354--373), kmatch

    全文阅读:https://www.lianxh.cn/news/2da90377100cf.html

    更多相关内容
  • 倾向得分匹配分析 (PSM) 已经在诸多领域得到了应用。虽然 PSM 不能完全解决内生性问题,但却能在很大程度上缓解自我选择问题导致的偏差。在前期文献中,Becker & Ichino (2002, Stata Journal, ...

    作者:丁海 (华中科技大学)

    Stata 连享会: 知乎 | 简书 | 码云 | CSDN

    Stata连享会 精品专题 || 精彩推文
    点击此处-查看完整推文列表

    2019暑期“实证研究方法与经典论文”专题班-连玉君-江艇主讲

    2019暑期“实证研究方法与经典论文”专题班-连玉君-江艇主讲

    倾向得分匹配分析 (PSM) 已经在诸多领域得到了应用。虽然 PSM 不能完全解决内生性问题,但却能在很大程度上缓解自我选择问题导致的偏差。在前期文献中,Becker & Ichino (2002, Stata Journal, 2(4):358-377) 对 PSM 的分析过程进行了详细的介绍,Stata 中也有多个命令可以执行 PSM 分析,如 pscore, psmatch2, treatrew (Stata Journal, 14(3): 541-561), gpscore (SJ 8(3):354–373), kmatch

     net describe st0328, from(http://www.stata-journal.com/software/sj14-1)
    

    平衡性假设

    在 PSM 匹配时,用treat变量对控制变量进行Logit回归,得到倾向得分值。倾向得分值最接近的控制组个体即为实验组的配对样本,通过这种方法可以最大程度减少实验组与控制组个体存在的系统性差异,从而减少估计偏误。在进行PSM匹配后的其他估计前比如PSM-DID 估计前,还需进行协变量的平衡性假设检验,即匹配后各变量在实验组和控制组之间是否变得平衡,也就是说实验组和控制组协变量的均值在匹配后是否具有显著差异。如果不存在显著差异,则支持进一步的模型估计。

    在平衡性检验之前,我们先使用psmatch2命令进行PSM匹配,处理变量为train,协变量为ageeducblack,结果变量为re78,采用一对一近邻匹配,具体操作如下:

     use ldw_exper.dta,clear
     psmatch2 train age educ black, out(re78) logit ate neighbor(1) common caliper(.05) ties
    

    PSM 匹配完成之后,我们需要检验匹配后的样本是否满足平衡性假设,即实验组与控制组的匹配协变量是否没有显著性差异,在这里可以使用pstest命令进行检验,具体如下:

     pstest age educ black hisp married , t(train)  
    

    平衡性假设检验结果如下:

    ------------------------------------------------------------------------------
                            |       Mean               |     t-test    |  V(T)/
    Variable                | Treated Control    %bias |    t    p>|t| |  V(C)
    ------------------------+--------------------------+---------------+----------
    age                     | 25.527   24.714     11.4 |   1.19  0.234 |  1.24
    educ                    | 10.291   10.401     -6.0 |  -0.59  0.557 |  1.60*
    black                   | .84066   .87363     -8.9 |  -0.90  0.370 |     .
    hisp                    | .06044   .09066    -10.9 |  -1.09  0.277 |     .
    married                 | .18681    .1522      9.2 |   0.88  0.380 |     .
    ------------------------------------------------------------------------------
    

    根据t检验结果发现,以上5个协变量在实验组与控制组之间不存在显著性差异。

    那么,在进行 PSM 分析之前,应当如何选择匹配协变量,使模型实现最佳的拟合效果呢?今天介绍的 psestimate 命令可以通过比较不同模型的极大似然值,帮助我们选择能实现最佳拟合效果的协变量的一阶和二阶形式。

    The psestimate command estimates the propensity score proposed by Imbens and Rubin (2015). The main purpose of the program is to select a linear or quadratic function of covariates to include in the estimation function of the propensity score.

    1. 命令的安装与示例数据导入

    在Stata命令窗口执行第一行代码即可完成对 psestimate 命令的下载,然后输入第二行命令下载网上示例数据 nswre74.dta(LaLonde, 1986),并执行第三行命令导入数据。

    ssc install psestimate, replace //安装命令
    net get psestimate  //下载命令附带的数据到当前工作路径下
    use "psestimate.dta", replace
    

    2. 命令的语法

    该命令的语法如下:

     psestimate depvar [indepvars] [if] [in] [, options]
     options:             
          totry(indepvars)     
          notry(varlist)       
          nolin               
          noquad              
          clinear(real)       
          cquadratic(real)    
          iterate(#)          
          genpscore(newvar)   
          genlor(newvar)
    

    各个主要选项的含义如下:

    • depvar,必选项,填入处理变量(如 treat),即标记是否参与实验的虚拟变量
    • indepvars,可选项,指定基准模型中的协变量
    • totry(indepvars),可选项,放入供选择的协变量列表,默认为全部
    • notry(varlist),可选项,指定不包括的协变量列表,默认为没有
    • nolin,可选项,指定不进行一阶多项式的选择
    • noquad,可选项,指定不进行二阶多项式的选择
    • clinear(real),可选项,指定一阶协变量似然比检验的门槛值,默认值为 1
    • cquadratic(real),可选项,指定二阶协变量似然比检验的门槛值,默认值是 2.71
    • iterate(#),可选项,指定在每个 logit 中执行循环的最大值,默认值是 16000
    • genpscore(newvar),可选项,由于指定程序自动生成的用于记录倾向得分值的新变量的名称
    • genlor(newvar),可选项,生成对数似然比的新变量的名称

    3. 命令操作

    3.1 命令基本操作

    下面本文将基于 psestimate 命令的作者提供的数据集 nswre74.dta 来简要说明如何使用 psestimate 这一命令来选择能最好拟合处理变量 (treat) 的协变量的一阶及二阶形式。

    在这里,我们事先选定教育变量 ed 作为基准模型中的一个协变量,意味着 Stata 自动将 ed 放入基准模型中。另外,我们将指定 ageblackhispnodeg 四个变量作为待选协变量。代码如下:

    use "nswre74.dta", clear
    psestimate treat ed, totry(age black hisp nodeg)
    

    运行结果如下:

    Selecting first order covariates... (10)
    ----+--- 1 ---+--- 2 ---+--- 3 ---+--- 4 ---+--- 5 
    ...s..s..
    Selected first order covariates are: nodeg hisp
    Selecting second order covariates... (21)
    ----+--- 1 ---+--- 2 ---+--- 3 ---+--- 4 ---+--- 5 
    .....s.....
    Selected second order covariates are: c.nodeg#c.ed
    Final model is: ed nodeg hisp c.nodeg#c.ed
    

    根据以上结果,可以确定在倾向得分匹配中,我们应该选取的一阶协变量为 nodeghisp,二阶协变量为 c.nodeg#c.ed。综上,根据 psestimate 命令的运算结果,我们应该选取 ednodeghispc.nodeg#c.ed 等四个变量作为倾向得分匹配的协变量。

    3.2 提升运算速度

    psestimate命令在运算中会耗费较长时间,而通常来说,该命令在选择协变量的一阶形式时要快于二阶形式的选择,因此,为了加快运算速度,我们可以首先通过加入noquad选项,只对协变量的一阶形式进行筛选,当一阶形式选定后,将其作为解释变量放入基准模型中,然后加入nolin 选项跳过一阶形式筛选步骤,只对协变量的二阶形式进行筛选。具体操作如下。

    首先,加入入noquad选项,只筛选协变量的一阶形式,如下:

    use "nswre74.dta", clear
    psestimate treat ed, totry(age black hisp nodeg) noquad
    

    一阶协变量的筛选结果如下:

    Selecting first order covariates... (10)
    ----+--- 1 ---+--- 2 ---+--- 3 ---+--- 4 ---+--- 5 
    ...s..s..
    Selected first order covariates are: nodeg hisp
    Final model is: ed nodeg hisp
    

    然后,将选定的ednodeghisp作为解释变量放入基准模型中,加入nolin选项值进行二阶形式的筛选,操作如下:。

    psestimate treat ed nodeg hisp , totry(age black hisp nodeg) nolin
    

    二阶协变量的筛选结果如下:

    Selecting second order covariates... (21)
    ----+--- 1 ---+--- 2 ---+--- 3 ---+--- 4 ---+--- 5 
    .....s.....
    Selected second order covariates are: c.nodeg#c.ed
    Final model is: ed nodeg hisp  c.nodeg#c.ed
    

    4. psestimate 的核心思想

    4.1 协变量一阶形式的选择

    第一步,该程序首先在基准模型(logit treat ed)基础上通过循环分别加入 totry() 中指定的四个变量 ageblackhispnodeg,进行四次模型估计,如下所示:

    logit treat ed age
    logit treat ed black
    logit treat ed hisp
    logit treat ed nodeg
    

    每次估计完成后,它将得到的新的极大似然值与基准模型比较,选择上述四个模型中对数极大似然值 (Log-Likelihood, 简称 LL 值) 最大的模型中的协变量放入基准模型中,除非上述四个模型的极大似然值都低于 clinear(real) 中指定的门槛值。若此处假设为 nodeg,则基准模型扩展为 logit treat ed nodeg, 然后第二步,它将估计如下模型:

    logit treat ed nodeg age
    logit treat ed nodeg black
    logit treat ed nodeg hisp
    

    这一步的协变量筛选原则与第一步相同。可以看出,当供选择的协变量数量为 C C C 时,在确定协变量的一阶形式时,该程序理论上会估计 ∑ C ∑C C 个 Logit 模型。本例中有 4 个供选择的协变量,则需要估计 10 次(如下括号中所示),该命令选择的协变量一阶形式结果如下:

    Selecting first order covariates... (10)
    ----+--- 1 ---+--- 2 ---+--- 3 ---+--- 4 ---+--- 5 
    ...s..s..
    Selected first order covariates are: nodeg hisp
    

    4.2 协变量二阶形式的选择

    在协变量二阶形式的选择上,主要分为协变量平方项以及协变量间的交乘项。
    如果在一阶形式中只选择了 a 这一个协变量,则二阶形式的选择只需要检验 a^2 这一变量。但是如果有 ab 两个一阶协变量被选择,则二阶形式的选择需要检验 a2**、**b2ab 三个二阶协变量形式。具体到本例,确定的一阶协变量有 ednodeghisp 三个,则需要检验的二阶协变量有六个,即 ed2**、**nodeg2hisp^2c.ed#c.nodegc.ed#c.hispc.nodeg#c.hisp,筛选过程与选择协变量一阶形式的方法一致。因此本例中共需估计 ∑ 6 ∑6 6 即 21 次(如下括号中所示),结果如下所示:

    Selecting second order covariates... (21)
    ----+--- 1 ---+--- 2 ---+--- 3 ---+--- 4 ---+--- 5 
    .....s.....
    Selected second order covariates are: c.nodeg#c.ed
    Final model is: ed nodeg hisp c.nodeg#c.ed
    

    4.3 流程图展示

    如下流程图可以更加直观地展现psestimate筛选协变量一阶及二阶形式的过程,为简化分析,我们可供选择的协变量为ab两个变量,假设各模型的对数极大似然值存在如下大小关系,LL1>LL2> clinear() >LL3,LL4>LL5>LL6> cquadratic() >LL7>LL8。

    图1.流程图

    5. PSM估计的完整流程示例

    5.1 psestimate 筛选匹配变量的一阶、二阶形式

    第一步,使用psestimate筛选匹配变量

    use "nswre74.dta", clear
    psestimate treat ed, totry(age black hisp nodeg) 
    

    匹配变量选择如下:

    Selecting first order covariates... (10)
    ----+--- 1 ---+--- 2 ---+--- 3 ---+--- 4 ---+--- 5 
    ...s..s..
    Selected first order covariates are: nodeg hisp
    Selecting second order covariates... (21)
    ----+--- 1 ---+--- 2 ---+--- 3 ---+--- 4 ---+--- 5 
    .....s.....
    Selected second order covariates are: c.nodeg#c.ed
    Final model is: ed nodeg hisp c.nodeg#c.ed
    

    最终选择的匹配变量为ednodeghispc.nodeg#c.ed

    5.2 psmatch2 基于筛选出的匹配变量进行PSM匹配

    基于上述匹配变量进行PSM匹配:

     psmatch2 treat ed nodeg hisp c.nodeg#c.ed, logit ate neighbor(1) common caliper(.05) ties
    

    结果如下:

    Logistic regression                             Number of obs     =        445
                                                    LR chi2(4)        =      17.03
                                                    Prob > chi2       =     0.0019
    Log likelihood = -293.58317                     Pseudo R2         =     0.0282
    
    ------------------------------------------------------------------------------
           treat |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
    -------------+----------------------------------------------------------------
              ed |   .5093428   .3298117     1.54   0.123    -.1370762    1.155762
           nodeg |   6.506319   4.112404     1.58   0.114    -1.553845    14.56648
            hisp |  -.5954105   .3754841    -1.59   0.113    -1.331346    .1405248
                 |
    c.nodeg#c.ed |  -.6068825   .3375387    -1.80   0.072    -1.268446    .0546813
                 |
           _cons |  -6.021438    4.05441    -1.49   0.138    -13.96794    1.925059
    ------------------------------------------------------------------------------
    
    

    5.3 pstest 进行平衡性假设检验

     pstest ed nodeg hisp c.nodeg#c.ed, t(treat)  
    

    结果如下:

    ------------------------------------------------------------------------------
                            |       Mean               |     t-test    |  V(T)/
    Variable                | Treated Control    %bias |    t    p>|t| |  V(C)
    ------------------------+--------------------------+---------------+----------
    ed                      |  10.29   10.464     -9.6 |  -0.91  0.363 |  1.28
    nodeg                   | .71585   .69399      5.3 |   0.46  0.648 |     .
    hisp                    | .06011   .06011     -0.0 |  -0.00  1.000 |     .
    c.nodeg#c.ed            | 6.7814    6.694      2.1 |   0.18  0.854 |  0.96
    ------------------------------------------------------------------------------
    

    可以发现,匹配后实验组与控制组的匹配变量均没有显著差异,满足平衡性假设条件

    5.4 psgraph 绘图直观呈现各匹配变量的平衡性状况

      psgraph  
    

    结果如下:

    psgraph

    图中也可以直观看出,实验组与控制组的倾向得分值分布大致平衡。

    参考文献

    1. Dehejia, Rajeev H. and Sadek Wahba. 1999. “Causal Effects in Nonexperimental Studies”. Journal of the American Statistical Association 94(448): 1053-1062.
    2. Imbens, Guido W. and Donald B. Rubin. 2015. Causal Inference in Statistics, Social, and Biomedical Sciences. New York: Cambridge University Press.
    3. Imbens, Guido W. 2015. “Matching Methods in Practice: Three Examples.” Journal of Human Resources 50 (2): 373–419. [PDF1][PDF2-wp]
    4. LaLonde, Robert J. 1986. “Evaluating the Econometric Evaluations of Training Programs with Experimental Data.” The American Economic Review 76 (4): 604–20. [PDF]

    关于我们

    • Stata 连享会(公众号:StataChina)】由中山大学连玉君老师团队创办,旨在定期与大家分享 Stata 应用的各种经验和技巧。
    • 公众号推文同步发布于 CSDN-Stata连享会简书-Stata连享会知乎-连玉君Stata专栏。可以在上述网站中搜索关键词StataStata连享会后关注我们。
    • 点击推文底部【阅读原文】可以查看推文中的链接并下载相关资料。
    • Stata连享会 精品专题 || 精彩推文

    联系我们

    • 欢迎赐稿: 欢迎将您的文章或笔记投稿至Stata连享会(公众号: StataChina),我们会保留您的署名;录用稿件达五篇以上,即可免费获得 Stata 现场培训 (初级或高级选其一) 资格。
    • 意见和资料: 欢迎您的宝贵意见,您也可以来信索取推文中提及的程序和数据。
    • 招募英才: 欢迎加入我们的团队,一起学习 Stata。合作编辑或撰写稿件五篇以上,即可免费获得 Stata 现场培训 (初级或高级选其一) 资格。
    • 联系邮件: StataChina@163.com

    往期精彩推文


    欢迎加入Stata连享会(公众号: StataChina)

    展开全文
  • 原文链接:... 目 录 1. 命令的安装与示例数据导入 2.... 3.... 4.... 4.1 变量一阶形式的选择 4.2 变量二阶形式的选择 ... 5.... 5.1 psestimate 筛选匹配变量的一阶、二阶形式 5.2 psmatch2 基于筛

    原文链接:https://www.lianxh.cn/news/af9a796f8d45c.html

    目 录

    倾向得分匹配分析 (PSM) 已经在诸多领域得到了应用。虽然 PSM 不能完全解决内生性问题,但却能在很大程度上缓解自我选择问题导致的偏差。在前期文献中,Becker & Ichino (2002, Stata Journal, 2(4):358-377) 对 PSM 的分析过程进行了详细的介绍,Stata 中也有多个命令可以执行 PSM 分析,如 pscorepsmatch2treatrew (Stata Journal, 14(3): 541-561), gpscore (SJ 8(3):354--373), kmatch

    net describe st0328, from(http://www.stata-journal.com/software/sj14-1)
    展开全文
  • stata 倾向得分匹配操作

    万次阅读 多人点赞 2019-05-06 20:08:00
    ssc install psmatch2,replace *安装倾向得分匹配命令包 cd "C:\Users\Administrator\Desktop\stata work" *设置工作路径 use ldw_exper.dta,clear *读取数据(数据放在工作路径) reg re78 t,r *做一元线性回归...

    倾向得分匹配法是一种研究方法,它在研究某项治疗、政策、或者其他事件的影响因素上很常见。对于经济、金融学领域来说,比如需要研究某个劳动者接受某种高等教育对其收入的影响,或者比如研究某个企业运用了某项管理层激励措施以后对企业业绩的影响。如果我们简单地将是否执行了某项时间作为虚拟变量,而对总体进行回归的话,参数估计就会产生偏误,因为在这样的情况下,我们只观察到了某一个对象他因为发生了某一事件后产生的表现,并且拿这种表现去和另一些没有发生这件事情的其他对象去做比较。这样的比较显然是不科学的,因为比较的基础并不同。

    通俗地说,我们真正要做的是考虑,如果拿小明来说,小明读了研究生和小明没有读研究生,他的收入会差多少?可是小明已经读了研究生,我怎么才能估计出他要是不读研究生,他的收入会是多少呢?

    于是,我们引入“倾向得分匹配”这样一种研究方法。英文叫Propensity Score Matching。这种方法能让我们从一大堆没有参加培训的人群中(也就是我们的总体样本的一个子集),对每个人读研究生的概率进行估计,然后选出和小明具有非常相似的去读研究生的概率,可是没有去读的同学小刚——作为小明的对照,然后再来看他们的区别。当样本中的每个研究生”小明“都找到了匹配的非研究生”小刚“,我们便能对这两组样本进行比较研究了。

    下面以陈强高级计量经济学及stata应用书中的例子来实现倾向得分匹配的应用,该案例研究参加就业培训是否能显著提高实际收入。数据附文后(百度网盘提取)

        ssc install psmatch2,replace  *安装倾向得分匹配命令包
        cd "C:\Users\Administrator\Desktop\stata work" *设置工作路径
        use ldw_exper.dta,clear    *读取数据(数据放在工作路径)
        reg re78 t,r    *做一元线性回归作为参照  (re78表示1978年实际收入,t是否参加培训)
    

    在这里插入图片描述

    *在未控制任何协变量的情况下,平均处理效应为1.794,即参加培训的平均比没有参加培训的收入高1.794千美元

     reg re78 t age educ black hisp married re74 re75 u74 u75,r
    

    *age为年龄,educ为教育年限,black为是否黑人,hisp是否拉丁裔,married(是否已婚),re74,re75表示1974年,1975年实际收入,u74,u75表示1974年,1975年是否失业

    在这里插入图片描述
    *加入协变量后,处理效应略有下降,1.672和之前比变化不大,协变量中黑人和教育显著,其它不显著

    *下面进行一对一匹配

     psmatch2 t age educ black hisp married re74 re75 u74 u75,outcome(re78) n(1) ate ties logit common
    

    t为处理变量,后面均为协变量,re78为结果变量,logit来估计结果,ties表包括所有倾向得分相同的并列个体,ate表同时汇报ATE,ATU,ATT,common表示仅对共同取值范围内个体
    *进行匹配

    在这里插入图片描述

    结果显示,ATT=1.41,t=1.68小于临界值,不显著ATE,ATU类似。Unmatched表示不匹配的结果,和一元回归结果一样,最下面显示控制组有11个不在共同范围内,处理组有2个不*在共同范围,其余432个均在范围内

    *考虑自助法估计标准误

    set seed 2019
    bootstrap r(att) r(atu) r(ate),reps(500):psmatch2 t age educ black hisp married re74 re75 u74 u75,outcome(re78) n(1) ate ties logit common
    

    在这里插入图片描述

    *下面使用pstest来考查匹配结果是否较好平衡了数据

    quiet psmatch2 t age educ black hisp married re74 re75 u74 u75,outcome(re78) n(1) ate ties logit common
    pstest age educ black hisp married re74 re75 u74 u75,both graph
    

    在这里插入图片描述
    在这里插入图片描述

    *下面画条形图来显示倾向得分匹配的共同取值范围

    psgraph
    

    在这里插入图片描述

    *从上图可以直观看出,大多数均在共同取值范围内(on support),匹配时仅会损失少量样
    *本

    *下面进行k近邻匹配,令k=4,节省空间,采用quietly省去结果的汇报

    psmatch2 t age educ black hisp married re74 re75 u74 u75,outcome(re78) n(4) ate ties logit common quietly
    

    在这里插入图片描述
    *上表显示,一对四匹配和一对一匹配类似,下面进行卡尺内一对四匹配,首先计算倾向得分的标准差,乘以0.25

    在这里插入图片描述

    sum _pscore
    dis 0.25*r(sd)
    

    0.01979237

    *由此可知0.25倍的标准差约等于0.02,将卡尺范围定为0.01,对倾向得分相差1%的观测
    *值进行一对四匹配

    psmatch2 t age educ black hisp married re74 re75 u74 u75,outcome(re78) n(4) cal(0.01) ate ties logit common quietly
    

    在这里插入图片描述

    *上表显示,大多数一对四匹配发生在卡尺0.01范围内,不存在太远的近邻,进行半径(卡尺)匹配

    psmatch2 t age educ black hisp married re74 re75 u74 u75,outcome(re78) radius cal(0.01) ate ties logit common quietly
    

    在这里插入图片描述

    *匹配结果依然类似,下面进行核匹配

    psmatch2 t age educ black hisp married re74 re75 u74 u75,outcome(re78) kernel ate ties logit common quietly
    

    在这里插入图片描述

    *结果依然类似,进行局部线性回归匹配(使用默认核函数与带宽)

    psmatch2 t age educ black hisp married re74 re75 u74 u75,outcome(re78) llr ate ties logit common quietly
    

    在这里插入图片描述

    *上表未汇报ATT标准误,采用自助法得到标准误

    set seed 2019
    bootstrap r(att) r(atu) r(ate),reps(500):psmatch2 t age educ black hisp married re74 re75 u74 u75,outcome(re78) llr ate ties logit common quietly
    

    在这里插入图片描述

    *根据上表自助标准误,对平均处理效应的三种度量均至少在5%水平上显著
    *下面进行条匹配(同样使用自助法),先安装一个非官方命令spline

    findit snp7_1
    set seed 2019
    bootstrap r(att) r(atu) r(ate),reps(500):psmatch2 t age educ black hisp married re74 re75 u74 u75,outcome(re78) spline ate ties logit common quietly
    

    在这里插入图片描述

    *估计结果仍然类似,总之,以上各匹配得分结果显示,参加就业培训的平均处理效应为正,在经济意义和统计意义上均显著
    *最后进行马氏匹配,计算异方差稳健标准误

    psmatch2 t, outcome(re78) mahal(age educ black hisp married re74 re75 u74 u75) n(4) ai(4) ate 
    

    在这里插入图片描述
    *分析结果类似,证实上述结果非常稳健

    链接:https://pan.baidu.com/s/18pReupZyZQpS2Wfxe1GV1A
    提取码:wuih
    本操作使用的数据请从百度云盘提取

    展开全文
  • 1.在应用倾向匹配法进行因果推断时需要注意后续的检验理论,否则容易妄议因果。 2.什么是倾向匹配法? 将各个手册单元多维度的信息,使用统计方法简化成一维的数值,是为倾向值,然后据之进行匹配匹配的目的...
  • PSM倾向得分匹配

    千次阅读 2021-10-30 16:34:48
    显然,在模型 (1) 的设定中,我们可能忽略了一些同时影响「解释变量」——是否上大学() 和「被解释变量」——收入() 的因素,例如,家庭背景、能力、动机、个人兴趣等。这些因素被称为「共同因素 (Common Factors)」...
  • 该文章主要介绍倾向得分匹配(PSM, Propensity Score Matching)方法的原理以及实现。这是一种理论稍微复杂、但实现较为容易的分析方法,适合非算法同学的使用。可用于(基于观察数据的)AB实验、增量模型搭建等领域...
  • 原标题:倾向得分匹配(PSM)操作过程与问题反思 Part II 倾向得分匹配方法1.数据来源来源:网络资源,其实也比较容易找,比如人大经济论坛。但为了避免相关的版权争议,我重新写了一个do文件,处理的方法和变量也有...
  • PSM倾向得分匹配法【python实操篇】

    千次阅读 2022-01-06 23:38:21
    对于PSM原理不太熟悉的同学可以看看前一篇文章:PSM倾向得分匹配法【上篇:理论篇】 目前网上PSM实操的相关文章都是R语言、SPSS和STATA实现的,少数Python版本代码不全,可读性有限(有些甚至要钱。。。) 所以我想...
  • 倾向得分匹配PSM是因果推断中的一种统计学方法,用于处理观察研究的数据。在观察研究中,由于种种原因,数据偏差和混杂变量较多。倾向评分匹配的方法正是为了减少这些偏差和混杂变量的影响,以便对实验组和对照组...
  • Stata+PSM:倾向得分匹配分析简介

    千次阅读 2021-07-24 14:28:38
    目录 1. PSM 简介 ... PSM 匹配样本的回归 参考文献 . PSM 简介 在经济学中,我们通常希望评估某项公共政策实施后的效应,为此,我们构建 "处理组" 和 "控制组" 以评估「处理效应 (treatment effect)
  • 倾向得分匹配法(PSM)举例及stata实现偏好分数匹配法(PSM)和stata实施-阅读注释[示例]政策背景:国家支持的工作,新南威尔士州)研究目标:测试接受或不接受计划(培训)对工资的影响基本思想是分析培训组和非培训组之间的...
  • 数据上传SPSSAU后,在 “我的数据”中查看浏览原始数据,前5行数据如下:图1 “我的数据”查看浏览数据集本例采用半径匹配算法,卡钳值多少合适呢?原则上并没有严格的规定或标准。可以通过多次遍历的形式,比如第一...
  • 倾向得分匹配法 PSM

    千次阅读 2020-12-30 23:27:24
    use "E:\倾向得分匹配PSM\20200727.dta" xtset ID YEAR (2)数据描述 describe 将原数据中的变量取对数后对应的变量为: global xlist "Ln_gdp Ln_gdp2 Ln_indus1 Ln_imex Ln_ppc Ln_ppc2 Ln_freight Ln_...
  • Matching是一个R包,它提供了用于多变量倾向得分匹配以及基于遗传搜索算法找到最佳协变量平衡的功能。 提供了各种单变量和多变量度量来确定是否已实际获得平衡。 底层的匹配算法是用C ++编写的,可以广泛使用系统...
  • 倾向得分匹配法(PSM )举例及stata 实现——读书笔记1【例】培训对工资的效应政策背景:国家支持工作示范项目(National Supported Work,NSW )研究目的:检验接受该项目(培训)与不接受该项目(培训)对工资的影响。...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 1,577
精华内容 630
热门标签
关键字:

倾向得分匹配协变量