精华内容
下载资源
问答
  • 2021-04-20 11:11:06

    Title

    [U] 11.4.3 Factor variables

    Description

    Factor variables are extensions of varlists of existing variables.  When a command allows factor variables, in

    addition to typing variable names from your data, you can type factor variables, which might look like

    i.varname

    i.varname#i.varname

    i.varname#i.varname#i.varname

    i.varname##i.varname

    i.varname##i.varname##i.varname

    Factor variables create indicator variables from categorical variables, interactions of indicators of categorical

    variables, interactions of categorical and continuous variables, and interactions of continuous variables

    (polynomials).  They are allowed with most estimation and postestimation commands, along with a few other

    commands.

    There are four factor-variable operators:

    Operator  Description

    ————————————————————————————————————-

    i.        unary operator to specify indicators

    c.        unary operator to treat as continuous

    #         binary operator to specify interactions

    ##        binary operator to specify factorial interactions

    ————————————————————————————————————-

    The indicators and interactions created by factor-variable operators are referred to as virtual variables.  They

    act like variables in varlists but do not exist in the dataset.

    Categorical variables to which factor-variable operators are applied must contain nonnegative integers with values

    in the range 0 to 32,740, inclusive.

    Factor variables may be combined with the L. and F. time-series operators.

    Remarks

    Remarks are presented under the following headings:

    Basic examples

    Base levels

    Selecting levels

    Applying operators to a group of variables

    Basic examples

    Here are some examples of use of the operators:

    Factor

    specification     Result

    ————————————————————————————————————-

    i.group           indicators for levels of group

    i.group#i.sex     indicators for each combination of levels of group and sex, a two-way interaction

    group#sex         same as i.group#i.sex

    group#sex#arm     indicators for each combination of levels of group, sex, and arm, a three-way interaction

    group##sex        same as i.group i.sex group#sex

    group##sex##arm   same as i.group i.sex i.arm group#sex group#arm sex#arm group#sex#arm

    sex#c.age         two variables — age for males and 0 elsewhere, and age for females and 0 elsewhere; if age

    is also in the model, one of the two virtual variables will be treated as a base

    sex##c.age        same as i.sex age sex#c.age

    c.age             same as age

    c.age#c.age       age squared

    c.age#c.age#c.age age cubed

    ————————————————————————————————————-

    Base levels

    You can specify the base level of a factor variable by using the ib. operator.  The syntax is

    Base

    operator(*)    Description

    ———————————————————————————————————–

    ib#.           use # as base, #=value of variable

    ib(##).        use the #th ordered value as base (**)

    ib(first).     use smallest value as base (the default)

    ib(last).      use largest value as base

    ib(freq).      use most frequent value as base

    ibn.           no base level

    ———————————————————————————————————–

    (*) The i may be omitted.  For instance, you may type ib2.group or b2.group.

    (**) For example, ib(#2). means to use the second value as the base.

    If you want to use group==3 as the base in a regression, you can type,

    . regress y  i.sex ib3.group

    You can also permanently set the base levels of categorical variables by using the fvset command.

    更多相关内容
  • (2)如果变量本身不符合正态分布,取 了对数后可能渐近服从正态分布 (3)模型形式的需要,让模型具有经济学意义。 采用四种规则: (1)与市场价值相关的,例如,价格、销售额、工资等都可以取对数; (2)以...

    什么时候取对数

    一、伍德里奇的取对数规则:

    为了解决

    (1)减弱数据的异方差性

    (2)如果变量本身不符合正态分布,取 了对数后可能渐近服从正态分布

    (3)模型形式的需要,让模型具有经济学意义。

    采用四种规则:

    (1)与市场价值相关的,例如,价格、销售额、工资等都可以取对数;

    (2)以年度量的变量,如受教育年限、工作经历等通常不取对数;

    (3)比例变量,如失业率、参与率等,两者均可;

    (4)变量取值必须是非负数,如果包含0,则可以对y取对数ln(1+y);

    二、四类模型回归系数

    1、一元线性回归:𝑦 = 𝑎 + 𝑏𝑥 + 𝜇,x每增加1个单位,y平均变化b个单位;

    2、双对数模型:𝑙𝑛𝑦 = 𝑎 + 𝑏𝑙𝑛𝑥 + 𝜇,x每增加1%,y平均变化b%;

    3、半对数模型:𝑦=𝑎 + 𝑏𝑙𝑛𝑥 + 𝜇,x每增加1%,y平均变化b/100个单位;

    4、半对数模型:𝑙𝑛𝑦 = 𝑎 + 𝑏𝑥 + 𝜇,x每增加1个单位,y平均变化(100b)%。

    小批注:

    以上四类模型回归都可以用求导和微分方程给出。

    例如:𝑙𝑛𝑦 = 𝑎 + 𝑏𝑙𝑛𝑥 + 𝜇 左右式求导得出\frac{1}{y}b\frac{1}{x},那么​​​​​如果乘dy与dx,则表示双方的

    量,而由原公式得知,双方变化量相等,即自变量y与x变化dy与dxln(y+\Delta y)-lny=bln(x+\Delta x)-blnx

    当然,高数里也有此类内容的证明,那个应该是证明隐函数求导法则的,结果一样。

    三、虚拟变量的解释

    例如用1表示Female,0表示Male,将E代表薪水,有如下公式:

    E_{M}=\beta _{_{0}}+\delta _{0}\times 1+\beta _{1} X_{1}+\beta _{2} X_{2}.....+\mu _{i}

    E_{F}=\beta _{_{0}}+\delta _{0}\times 0+\beta _{1} X_{1}+\beta _{2} X_{2}.....+\mu _{i}

    以其他变量当作与性别无关的变量(例如职业能力,学历,智商等。前提是与性别无关),则\delta _{0}的正负就可以表示性别的差异工资,代表了每个小时相差多少钱。

     四、多分类的虚拟变量设置

    简化一下

    SUCESS表示是否贷款成功 

    SUCESS_{i}=\alpha +\beta _{i}Province_{i}+\lambda Control+\varepsilon _{i}

    那么根据\beta _{i}相较于内蒙古这一对照组的正负就可以判断是否有地域歧视了。

    五、含有交互项的自变量

    有某两个自变量相乘共同决定,代表了一个变量产生的效应会受到另一个变量的影响例如:

    展开全文
  • 2020.10.27 注解:本文为旧版本的读书笔记(仅限于对名义变量的虚拟变量行为,并未对此进行解读),实际等候更细致的更新来解释虚拟变量。PS 我点开以后才发现有人问我虚拟变量的问题,但是时间过久我就不再回复了...

    2020.10.27 注解:本文为旧版本的读书笔记(仅限于对名义变量的虚拟变量行为,并未对此进行解读),实际等候更细致的更新来解释虚拟变量。

    PS 我点开以后才发现有人问我虚拟变量的问题,但是时间过久我就不再回复了(之前没看到),并且我对HLM等操作也不是非常熟悉……

    2020年10月27日/新增(源自R章节部分摘录)

    R/Q2:正交对比与非正交对比:简单介绍

    注:本文为直接翻译,实际的编码章节待定写作中。

    III型平方和被称为边缘或正交的(marginal or orthogonal),其原因在于其计算方法导致(见上参考)。这也就意味着,在对数据进行方差分析时,你的虚拟编码必须是正交的,否则会导致计算错误;而我们经常见到的常规虚拟编码则是非正交的。

    因此,在使用III型平方和时,必须先制定自己的对比编码,或是使用其他函数对数据进行正交对比的重编码(例如Helmert contrast):

    contrasts(Data$variable)<-contr.helmert(3)

    更多数学拓展与参考请见:

    AhaDad:通过线性模型详解方差分析中“对比”(Contrasts)的数理原理​zhuanlan.zhihu.com
    AhaDad:不是那么学术的解释:方差分析中正交对比​zhuanlan.zhihu.com

    R/C11.3Q2 extend:虚拟编码中interaction的编码问题

    当我们将带有有序变量的分析转换成OLS回归时,常规的虚拟编码方式无法很好地反应交互项的分类,如下图所示。此时需要改变编码方式使其变得具有区分度。或者,心理学中常见的做法是将该部分分析单独提取出来,即我们所熟悉的主效应/交互效应分析。见

    陈曦:统计学基础笔记:初级统计技术​zhuanlan.zhihu.com
    87715b404379072f3522a718cc7dd97e.png

    3ac05d7ff9179f2251230c81aa08b307.png

    编码方式(预留坑,见书12.5.6)

    2019年5月1日旧版本

    实际经验结合读书笔记:定量研究系列 虚拟变量回归。Mellissa A. Hardy著。

    虚拟变量/哑变量(dummy code)一般在变量涉及到分类变量,并进行回归分析时会涉及到。对于平均数差异检验,请参见t检验/ANOVA/Factorial ANOVA。

    正常的OLS回归接受任何有序(你可以视为连续,也可以视为分类,这个取决于研究者的态度)、连续变量和二分变量。对于分类变量,必须进行哑变量/虚拟变量化。

    Logistic回归可以使用Multinominal Logistic回归来手动完成分类变量,因此不需要虚拟变量化。

    虚拟变量的个数需要是类别-1。其原理如下:

    12f63e2da537badece9b4982d88114c6.png
    传统的OLS回归无法接受类别变量(虽然你依然可以扔进去,但是却无法解释),但却接受二分变量。正因如此,你可以将单个变量拆成多道题,共同检验某个变量,如上。

    16d4639a24bd04dab44e62c94ac4faff.png
    具体coding方法,基本可以理解成将原来的编码拆成了二进制。需要注意的是,虚拟变量需要同进同出,否则同样无法解释。

    Break:Orthogonal contrast coding 正交比较编码与Classic dummy coding 传统虚拟编码

    上面展示的是传统的dummy coding。还有另一种dummy coding的方法叫contrast coding,要求其在正交层面上,任何相加值都为0。具体案例如下:

    4b6b21f21e44890a2df3ca616ae36538.png
    cont1与cont2,甚至包括二者相乘的product的sum都为0。这能保证他们在回归方程中的B为0。

    在一般OLS回归中,使用传统的虚拟编码问题不大,因为其展示的是不同群组的比较;在特殊场景下(例如:方差分析的正交对比与III型平方和问题,见R长章11 ANCOVA)

    Q:如何解读虚拟变量(二分变量)之间相关性的强弱?(与卡方相连接)

    7f5c410bdd974888d9bb35841ef06d10.png

    8a95ccb058c4efda3e2c08254d8493b0.png

    Q:控制组偏相关的解读?

    4c46454138cd9400acecce9f0e4caf16.png

    1d48e08a6a8676bc177f00eb78dc8203.png

    Q:虚拟变量的回归解读?

    b7284178f7470beac47dfc45ebea87b8.png

    Q:复杂数据的实验控制检验方法?

    57abc427da3ce8031de64687a431f80c.png

    Q:虚拟变量的交互效应?

    在普通的OLS回归中,我们假定各变量之间是线性独立的。在交互效应存在时,我们需要加入AxB的交互效应项来计算它的交互效应大小。对于虚拟变量,我们需要对每个虚拟变量分别进行乘积计算。这也就意味着,如果某个变量被转换成3个虚拟变量,我们就得加入3个交互效应虚拟变量项。

    展开全文
  • 这一章笔记围绕虚拟变量问题展开,主要介绍虚拟变量的引入形式和分析方法,重点介绍双重差分模型的应用方法。

    虚拟变量与双重差分

    虚拟变量的模型设定

    首先我们先对解释变量中的定性因素和定量因素作以下阐述:

    • 定量因素:可直接测度、数值性的因素;
    • 定性因素:属性因素,表征某种属性存在与否的非数值性的因素。

    在实际建模中,如何对定性因素进行回归分析?采用“虚拟变量”对定性变量进行量化是最常用的一种思路。其基本思想为:

    • 直接在回归模型中加入定性因素存在诸多的困难;
    • 可将这些定性因素进行量化,以达到定性因素能与定量因素有着相同作用之目的;
    • 有些定量因素也可以采取分组的方式来研究。

    虚拟变量设置的时候需要考虑以下的基本规则:

    • 总原则为:设置能够区分所有属性的最少虚拟变量。
    • 虚拟变量取“1”或“0”的原则,应从分析问题的目的出发予以界定。从理论上讲,虚拟变量取“0”值通常代表比较的基础类型;而虚拟变量取“1”值通常代表被比较的类型。
    • 如果定性因素具有 m m m 个相互排斥属性,当模型中含有截距项时,则只能引入 m − 1 m-1 m1 个虚拟变量;当模型中没有截距项时,则可以引入 m m m 个虚拟变量,否则就会陷入“虚拟变量陷阱”。
    • “虚拟变量陷阱”的实质:完全共线性。

    虚拟变量的回归分析

    在计量经济学中,通常引入虚拟变量的方式分为加法方式和乘法方式两种。

    • 加法方式:

    Y i = α 0 + β 1 X i + u i + α 1 D i   . Y_i=\alpha_0+\beta_1X_i+u_i+\alpha_1 D_i \ . Yi=α0+β1Xi+ui+α1Di .

    • 乘法方式:

    Y i = α 0 + β 1 X i + u i + β 2 X i D i   . Y_i=\alpha_0+\beta_1X_i+u_i+\beta_2X_iD_i \ . Yi=α0+β1Xi+ui+β2XiDi .

    实质上,加法方式引入虚拟变量改变的是截距,乘法方式引入虚拟变量改变的是斜率。

    含有虚拟变量的模型的分析手段:条件期望。

    以加法方式引入虚拟变量时,主要考虑的问题是定性因素的属性和引入虚拟变量的个数。主要有四种情况:

    • 解释变量只有一个定性变量而无定量变量,而且定性变量为两种相互排斥的属性;
    • 解释变量分别为一个两种属性的定性变量和一个定量变量;
    • 解释变量分别为一个定性变量(两种以上属性)和一个定量解释变量;
    • 解释变量分别为两个定性变量(各自分别是两种属性)和一个定量解释变量。

    以乘法方式引入虚拟变量时,是在所设立的模型中,将虚拟变量与其它解释变量的乘积,作为新的解释变量出现在模型中,以达到其调整设定模型斜率系数的目的。

    • 截距不变的情形: Y i = f ( X i ,   D i X i ) + u i Y_i=f(X_i,\,D_iX_i)+u_i Yi=f(Xi,DiXi)+ui
    • 截距和斜率均发生变化的情形: Y i = f ( X i ,   D i ,   D i X i ) + u i Y_i=f(X_i,\,D_i,\,D_iX_i)+u_i Yi=f(Xi,Di,DiXi)+ui

    虚拟变量的综合应用

    所谓虚拟变量的综合应用是指将引入虚拟解释变量的加法方式、乘法方式进行综合使用。基本分析方式仍然是条件期望分析。

    结构变化分析

    结构变化的实质是检验所设定的模型在样本期内是否为同一模型。显然,平行回归、共点回归、不同的回归三个模型均不是同一模型。

    • 平行回归模型的假定是斜率保持不变(加法类型,包括方差分析);
    • 共点回归模型的假定是截距保持不变(乘法类型,又被称为协方差分析);
    • 不同的回归的模型的假定是截距、斜率均为变动的(加法、乘法类型的组合)。

    例:比较改革开放前后我国居民平均“储蓄—收入”总量关系是否发生变化?

    模型设定为 :
    Y t = α 1 + α 2 D t + β 1 X t + β 2 ( D t X t ) + u t Y_t=\alpha_1+\alpha_2D_t+\beta_1X_t+\beta_2(D_tX_t)+u_t Yt=α1+α2Dt+β1Xt+β2(DtXt)+ut
    其中: Y t Y_t Yt 为储蓄总额, X t X_t Xt 为收入总额。
    D = { 1    , 改革开放前 0    , 改革开放后   . D=\left\{\begin{array}{cl} 1 \ \ , & \text{改革开放前} \\ 0 \ \ , & \text{改革开放后} \end{array}\right. \ . D={1  ,0  ,改革开放前改革开放后 .
    条件期望分析:

    • 改革开放后: E ( Y t ∣ X t ,   D t = 1 ) = α 1 + α 2 + ( β 1 + β 2 ) X t {\rm E}(Y_t|X_t,\,D_t=1)=\alpha_1+\alpha_2+(\beta_1+\beta_2)X_t E(YtXt,Dt=1)=α1+α2+(β1+β2)Xt
    • 改革开放前: E ( Y t ∣ X t ,   D t = 0 ) = α 1 + β 1 X t {\rm E}(Y_t|X_t,\,D_t=0)=\alpha_1+\beta_1X_t E(YtXt,Dt=0)=α1+β1Xt

    只要 α 2 \alpha_2 α2 β 2 \beta_2 β2 不同时为零,上述模型就能刻画改革开放前后我国居民平均“储蓄—收入”模型结构是否发生变化。

    交互效应分析

    交互作用:一个解释变量的边际效应有时可能要依赖于另一个解释变量。

    例:研究人群的个人收入 Y Y Y 与其教育水平 E E E 和所在地区 D D D 的关系。

    模型设定为:
    Y = α 0 + α 1 D 1 + α 2 D 2 + α 3 E + α 4 D 1 E + α 5 D 2 E + u   , Y=\alpha_0+\alpha_1D_1+\alpha_2D_2+\alpha_3E+\alpha_4D_1E+\alpha_5D_2E+u \ , Y=α0+α1D1+α2D2+α3E+α4D1E+α5D2E+u ,
    其中
    KaTeX parse error: Undefined control sequence: \ at position 104: …ght. \ , \ \ \ \̲ ̲D_2=\left\{\beg…
    各类人员的收入表如下:

    西部 ( 0 ,   0 ) (0,\,0) (0,0)中部 ( 1 ,   0 ) (1,\,0) (1,0)东部 ( 0 ,   1 ) (0,\,1) (0,1)
    中等 E = 0 E=0 E=0 α 0 \alpha_0 α0 α 0 + α 1 \alpha_0+\alpha_1 α0+α1 α 0 + α 2 \alpha_0+\alpha_2 α0+α2
    高等 E = 1 E=1 E=1 α 0 + α 3 \alpha_0+\alpha_3 α0+α3 α 0 + α 1 + α 3 + α 4 \alpha_0+\alpha_1+\alpha_3+\alpha_4 α0+α1+α3+α4 α 0 + α 2 + α 3 + α 5 \alpha_0+\alpha_2+\alpha_3+\alpha_5 α0+α2+α3+α5

    差异性描述:

    中部与西部差东部与西部差东部与中部差
    中等 E = 0 E=0 E=0 α 1 \alpha_1 α1 α 2 \alpha_2 α2 α 2 − α 1 \alpha_2-\alpha_1 α2α1
    高等 E = 1 E=1 E=1 α 1 + α 4 \alpha_1+\alpha_4 α1+α4 α 2 + α 5 \alpha_2+\alpha_5 α2+α5 α 2 − α 1 + α 5 − α 4 \alpha_2-\alpha_1+\alpha_5-\alpha_4 α2α1+α5α4

    各类人员的收入表如下:

    西部 ( 0 ,   0 ) (0,\,0) (0,0)中部 ( 1 ,   0 ) (1,\,0) (1,0)东部 ( 0 ,   1 ) (0,\,1) (0,1)
    高等与中等差 α 3 \alpha_3 α3 α 3 + α 4 \alpha_3+\alpha_4 α3+α4 α 3 + α 5 \alpha_3+\alpha_5 α3+α5

    双重差分模型

    双重差分法,Differences-in-Differences,基本思想就是通过对政策实施前后对照组和实验组之间差异的比较构造出反映政策效果的双重差分统计量。首先强调一点,一般而言 DID 仅适用于面板数据模型,但并没有严格意义上面板数据模型所需要的过多的假设,通过引入虚拟变量并通过最小二乘法即可实现参数估计。因此我们在讨论面板数据之前,先讨论双重差分模型的应用。

    前提假设:

    • 平行趋势假设:如果实验组的事件没有发生,对照组和实验组的变化趋势相同。
    • 检验方法:比较实验组和对照组样本的 Y Y Y t t t 的增长率在实验前有无显著差异。

    模型设定:
    Y i t = α + α 1 d i t + α 2 T i t + β d i t T i t + ε i t Y_{it}=\alpha+\alpha_1d_{it}+\alpha_2T_{it}+\beta d_{it}T_{it}+\varepsilon_{it} Yit=α+α1dit+α2Tit+βditTit+εit
    其中, Y i t Y_{it} Yit 为个体 i i i t t t 期的结果值,
    d i t = { 1    , i   为实验组 0    , i   为对照组 d_{it}=\left\{ \begin{array}{ll} 1 \ \ , & i\,\text{为实验组} \\ 0 \ \ , & i\,\text{为对照组} \\ \end{array} \right. dit={1  ,0  ,i为实验组i为对照组

    T i t = { 1    , 表示实验后 0    , 表示实验前 T_{it}=\left\{ \begin{array}{ll} 1 \ \ , & \text{表示实验后} \\ 0 \ \ , & \text{表示实验前} \\ \end{array} \right. Tit={1  ,0  ,表示实验后表示实验前

    对 DID 模型取数学期望:

    对照组+实验前
    E ( Y i t ∣ d i t = 0 ,   T i t = 0 ) = α {\rm E}(Y_{it}|d_{it}=0,\,T_{it}=0)=\alpha E(Yitdit=0,Tit=0)=α
    对照组+实验后
    E ( Y i t ∣ d i t = 0 ,   T i t = 1 ) = α + α 2 {\rm E}(Y_{it}|d_{it}=0,\,T_{it}=1)=\alpha+\alpha_2 E(Yitdit=0,Tit=1)=α+α2
    实验组+实验前
    E ( Y i t ∣ d i t = 1 ,   T i t = 0 ) = α + α 1 {\rm E}(Y_{it}|d_{it}=1,\,T_{it}=0)=\alpha+\alpha_1 E(Yitdit=1,Tit=0)=α+α1
    对照组+实验前
    E ( Y i t ∣ d i t = 1 ,   T i t = 1 ) = α + α 1 + α 2 + β {\rm E}(Y_{it}|d_{it}=1,\,T_{it}=1)=\alpha+\alpha_1+\alpha_2+\beta E(Yitdit=1,Tit=1)=α+α1+α2+β
    为了方便对比参数设定的意义,我们用如下的表格:

    对照组实验组
    实验前 α \alpha α α + α 1 \alpha+\alpha_1 α+α1
    实验后 α + α 2 \alpha+\alpha_2 α+α2 α + α 1 + α 2 + β \alpha+\alpha_1+\alpha_2+\beta α+α1+α2+β
    Difference α 2 \alpha_2 α2 α 2 + β \alpha_2+\beta α2+β

    将双重差分的思想与上表的内容结合,我们可以得到政策的净效应:
    D I D = α 2 + β − α 2 = β {\rm DID}=\alpha_2+\beta-\alpha_2=\beta DID=α2+βα2=β

    关键:检验交叉项系数 β ^ \hat\beta β^ 是否显著。

    双重差分模型的优点

    1. 可以很大程度上避免内生性问题的困扰:政策相对于微观经济主体而言一般是外生的,因而不存在逆向因果问题。此外,使用固定效应估计一定程度上也缓解了遗漏变量偏误问题。
    2. 传统方法下评估政策效应,主要是通过设置一个政策发生与否的虚拟变量然后进行回归,相较而言,双重差分法的模型设置更加科学,能更加准确地估计出政策效应。
    3. 双重差分法的原理和模型设置很简单,容易理解和运用,并不像空间计量等方法一样让人望而生畏。
    4. 尽管双重差分法估计的本质就是面板数据固定效应估计,但是 DID 听上去或多或少也要比 OLS、FE 之流更加“时尚高端”,因而 DID 的使用一定程度上可以满足“虚荣心”。
    展开全文
  • 当出现两个以上的因素时,我们可以采用双因素/多因素方差分析,探测主效应和不同因素之间的交互效应。 当方差分析出现显著性差异后,我们进行事后检验来进一步确定是哪一个因素出现了显著性差异,调用TukeyHSD( )...
  • 潘登同学的计量经济学笔记对定性信息的描述只有一个虚拟变量的情形虚拟变量系数的解释虚拟...虚拟变量交互作用虚拟变量与其他变量交互检验不同组之间回归函数上的差别邹至庄检验稍作改进二值因变量系数解释几点注意...
  • Stata:如何输入交互

    千次阅读 2021-11-06 17:36:11
    方法一:stata中使用命令 "gen c = a*b”产生新变量代表交互项c。 方法二:stata回归命令中输入命令:c.x1#c.x2。c.x1#c.x2前的系数代表交互性系数
  • 虚拟变量作为自变量,放在回归方程中在教科书里面讲的都很多,笔者以前在学习的时候觉得虚拟变量较之方差分析,还有更多惊喜。谢宇老师的《回归分析》书中对虚拟变量做了高度的总结与归纳。 虚拟变量回归只能做...
  • 虚拟变量与双重差分虚拟变量的模型设定首先我们先对解释变量中的定性因素和定量因素作以下阐述:定量因素:可直接测度、数值性的因素;定性因素:属性因素,表征某种属性存在与否的非数值性的因素。在实际建模中,...
  • 作者:胡杰 (中山大学岭南学院本科...在对有组别或者等级的数据进行处理时,常常需要利用虚拟变量和交乘项来探究各组之间或各等级之间的结构性的差异(Structural Difference) 例: 探究婚姻对女性工资造成的结构性...
  • 引言前几章涉及的自变量都为定量变量,本章将讨论... 虚拟变量与定量变量的交互作用,并应用邹至庄检验来检验各组是否存在显著差异 线性概率模型(本文不涉及) C7.1#(1) data_gpa1('/home/wangjianlong/files/pro
  • 原文链接:https://www.lianxh.cn/news/8359a0353aa1d.html 作者:连玉君 | 杨柳 ...注:该文已发表: 连玉君, 杨柳.... 2. 什么是因子变量 3. 常用回归模型的因子变量表述 3.1 范例 1:邹氏检验 3.2 ...
  • 创建哑变量(虚拟变量)的基本操作--一个变量2. 创建哑变量(虚拟变量)的基本操作--多个变量3. 考虑交互作用 前言 哑变量(DummyVariable) 引入哑变量的目的:将不能够定量处理的变量进行量化,在线性回归分析...
  • 因此我们需要将年龄分组,比如0-20岁、20-30岁等,此时就要将年龄转换为类别变量。 group 等分数据 必须先对数据进行排序 gen g_pri = group(price) recode 指定分界点 前开后闭区间 recode price (min/5000 ...
  • 【填空题】请根据所提供的字母 正确拼写出学习过的单词。 r g s a u 【填空题】请根据所提供的字母 正确拼写出学习过的单词。 c l s e i 【其它】 【单选题】肺气肿病人的胸廓最可能是 【其它】作业:...控制台交互如下
  • R语言中哑变量的设置

    万次阅读 多人点赞 2019-01-30 15:51:26
    在构建回归模型时,如果自变量X为连续性变量,回归系数β可以解释为:在其他自变量不变的条件下,X每改变一个单位,所引起的因变量Y的平均变化量;如果自变量X为二分类变量,例如是否饮酒(1=是,0=否),则回归系数...
  • Shell编程之变量

    千次阅读 2021-03-08 21:10:15
    本文主要对Shell中的变量进行简单总结,另外本文所使用的Linux环境为CentOS Linux release 8.1.1911,所使用的Shell为bash 4.4.19(1)-release。
  • 1. 时间趋势项与时间虚拟变量 1.1 时间趋势项 1.2 时间虚拟变量 1.3 二者的区别 2. Stata 范例 2.1 加入时间趋势项 3.2 改变划分时间虚拟变量的时间跨度 3. 拓展:DID 中加入时间趋势项 3.1 理论...
  • 基本概念:自变量和协变量

    万次阅读 2017-12-04 21:22:15
    变量是指研究者主动操纵,而引起因变量发生变化的因素或条件,因此自变量被看作是因变量的原因。 协变量:在实验的设计中,协变量是一个独立变量(解释变量),不为实验者所操纵,但仍影响响应。同时,它指与因变量有...
  • Steam VR虚拟现实手柄交互

    千次阅读 2019-01-12 12:44:10
    Steam vr虚拟现实手柄交互功能总结。 1、使用插件。 SteamVR_Unity_Toolkit+SteamVR Plugin; 2、行走区域设置。
  • 定量变量(Quantitative Variables):也称为数值型变量(Numerical Variables),可以用连续值或离散值表示。比如:气温(连续值),学生人数(离散值)。 为什么要对定量变量进行转换?大多数情况下,我们可以...
  • dummyVars函数: dummyVars creates a full set of dummy... less than full rank parameterization----建立一套完整的虚拟变量 survey<-data.frame(service=c("very unhappy","unhappy","neutral","happy","ve...
  • 实际硬件交互和实际测量仅适用于安装了 NI-DAQmx 和 NI_FGEN 驱动程序(均来自 National Instruments)的 Windows 机器。 其他功能(尤其是模拟模式)也适用于其他可能非 Windows 系统,前提是它们安装了足够新的 ...
  • 哑变量(Dummy Variables)也称虚拟变量,在回归中是一个很重要的概念。哑变量的引入使得回归模型变得更复杂,但对问题描述更简明而且接近现实。 对于二分类变量,实际在模型中的取值只有“0”和“1”两个值,无论...
  • 在LSDV法下,FE本质就是控制变量,所以在经济含义上,FE(包括交互FE)与一般意义上的控制变量并无二致。 那么,回归方程中为什么要加入控制变量?为了剥离其他因素的影响。设想一种极端情况,被解释变量yyy只对核心...
  • 数字控件相当于c语言和java中的int类型,文本控件相当于String 四、变量 1、新建一个变量控件,注意:va+数字开头的为变量控件,这是控件的名称,你可以自己修改 变量的位置很隐蔽,请看下面的箭头指向的位置,除了...
  • 通过分析虚拟环境中几种重要的接触力生成算法,结合人手的感知特性,构建了人手指接触力测量平台,研究了手指接触力和接触面积之间的关系,提炼出以接触面积为变量的指尖接触力的力学模型.仿生手的生理组织构造,...
  • 2233镇楼~新年第一篇当然是给陪伴吾等死肥宅这么久的B站,新年快乐~新的一年,穷B不买化妆品也要为自己氪大会员。...调节变量(moderator, interaction variable)也称为干扰变量,定义为一个变量可以系统性...
  • 什么是虚拟变量虚拟变量又称哑变量,是人为设定的用于将分类变量引入模型中的方法。 为什么要使用虚拟变量 在回归分析中,自变量X既可以是定量数据也可以定类数据。回归分析计算时是将所有自变量X视为数字,...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 99,729
精华内容 39,891
关键字:

交互虚拟变量