精华内容
下载资源
问答
  • 【原创】R语言异方差回归模型建模:用误差方差解释异方差数据分析报告论文(代码数据).docx
  • 博客中【零基础Eviews实例】异方差的检验与修正配套数据:(上个资源设计了动态调分不能修改,在此重新上传) 以“农村居民恩格尔系数的影响因素”为例,选择农村居民恩格尔系数(`Y`)为被解释变量,解释变量有农村...
  • 本文使用copulas概念对货币汇率依存结构进行统计建模。 GARCH-EVT-Copula模型用于估计货币汇率的投资组合风险价值(VaR)。 首先,单变量ARMA-GARCH模型用于过滤收益序列。 然后拟合广义帕累托分布,以对标准化残差...
  • 广义自回归条件异方差模型(GARCH)在我国股票市场中的实证研究,李泽光,曾剑秋,国家政策的推出对于股市的波动造成何种影响,是在研究我国股市波动性时需要关注的一个重要问题。本文即结合我国股票市场的实际发
  • 的完全非平稳、异方差高斯过程的实现。 平方指数核的三个关键组成部分——信号方差、长度尺度和噪声方差——都被建模为具有单独 GP 先验的函数。 梯度下降和后验的 HMC 采样支持 MAP 和完全后验解决方案。 目前只...
  • 论文研究-基于条件异方差分析的水文时序模型及其应用.pdf, 针对条件异方差现象在水文过程的时序研究中常被忽略的情况,建立了水文过程时间序列分析和预测模型. 首先, ...
  • 异方差

    千次阅读 2018-11-30 13:05:02
    异方差的实质 不同样本的残差项方差不同,即Var(σi)≠常数Var(\sigma_i) \ne 常数Var(σi​)̸​=常数,Var(σi)Var(\sigma_i)Var(σi​)于XiX_iXi​有关 产生的原因 模型中忽略了重要变量,XXX的相关性归入了残差...

    异方差的实质

    不同样本的残差项方差不同,即 V a r ( σ i ) ≠ 常 数 Var(\sigma_i) \ne 常数 Var(σi)̸= V a r ( σ i ) Var(\sigma_i) Var(σi) X i X_i Xi有关

    产生的原因

    1. 模型中忽略了重要变量, X X X的相关性归入了残差项。
    2. 模型设定错误,如非线性关系设定为线性关系,忽略重要解释变量。
    3. 数据测量误差。
    4. 截面数据中总体各单位的差异。截面数据比时间序列数据更容易产生异方差。

    异方差的后果

    1. 不变:OLS参数估计的线性性和无偏性
    2. 变:OLS参数估计的最小方差性变了,变得更小

    异方差的检验

    图示法

    第一步:将数据导入Eviews

    data y x
    

    第二步:画图:如果随着 X X X的增加, Y Y Y的离散程度有增加或减小的趋势则存在异方差。

    scat x y
    

    XY散点图
    第三步:残差分布图分析: 建立模型,对 X X X进行排序,在Equation窗口点击 Resids,观察残差分布的离散程度有无扩大趋势。

    ls y c x
    sort x
    

    残差分布图以上检验说明序列存在异方差性。

    GQ检验

    1. 原理:先将解释变量排序,删除中间C个样本( C = n / 4 C=n/4 C=n/4),最终取两个样本分别建立回归模型,比较 R S S 1 RSS_1 RSS1 R S S 1 RSS_1 RSS1 F F F统计量: F = R S S 1 R S S 2 F = \frac{RSS_1}{RSS_2} F=RSS2RSS1若两者存在显著差异,则表明存在异方差。
    2. 前提条件使用大样本容量,样本容量不低于参数个数的两倍。
    3. 假设 H 0 : 两 部 分 数 据 的 方 差 相 等 H_0:两部分数据的方差相等 H0: H 1 : 两 部 分 数 据 的 方 差 不 等 H_1:两部分数据的方差不等 H1:
    4. 判断 F > F α F>F_ \alpha F>Fα ,则拒绝原假设
    sort x
    smpl 1 10    # 确定样本1
    ls y c x    # RRS1 = 2579.59
    smpl 19 28    # 确定样本2
    ls y c x    #RRS2 = 63769.67
    

    White检验

    1. 原理:建立辅助回归模型 e i 2 = a 0 + α 1 x 1 i + α 2 x 2 i + α 3 x 1 i 2 + α 4 x 2 i 2 + α 5 x 1 i x 2 i + ⋯ e_i^2=a_0+ \alpha_1 x_{1i}+\alpha_2 x_{2i}+\alpha_3 x_{1i}^2+\alpha_4 x_{2i}^2+\alpha_5 x_{1i}x_{2i}+ \cdots ei2=a0+α1x1i+α2x2i+α3x1i2+α4x2i2+α5x1ix2i+
    2. 假设 H 0 : α 1 = α 2 = α 3 = α 4 = α 5 = 0 H_0:\alpha_1=\alpha_2=\alpha_3=\alpha_4=\alpha_5=0 H0:α1=α2=α3=α4=α5=0,没有异方差
    3. 判断:统计量 n R 2 nR^2 nR2大于临界值则拒绝原假设。
    4. 优点:可以判断是那个变量的哪种形式引起的异方差
    5. 缺点:引入太多变元,容易消耗自由度,有时可以把交叉项去掉
    ls y c x
    

    在Equation中:View\ Residual Diagnostics \ Heterosk…\ white

    Glejser检验

    1. 原理:建立辅助回归模型 ∣ e i ∣ = α + β x i h + v i , h = ± 1 , ± 2 , ⋯ \vert e_i \vert = \alpha+\beta x_i^h +v_i, h=\pm1,\pm2,\cdots ei=α+βxih+vi,h=±1,±2,
    2. 优点:可以判断是那个变量的哪种形式引起的异方差
    3. 缺点:函数形式不易确定,检验量太大
    4. 原假设:系数全等于0,不存在异方差

    异方差的补救

    1. 加权最小二乘法
      从White 检验和Glejser检验得到异方差是由哪个变量的具体形式得到的之后
    ls(w = 形式) y c x
    
    1. 对数变化法
    genr lny = log(y)
    genr lnx = log(x)
    ls lny c lnx
    

    再进行white检验

    展开全文
  • 用R语言对非平稳且异方差的时间序列进行分析,采用ARIMA-GARCH模型方法
  • 这是所描述的稀疏异方差高斯过程的matlab实现。 数据集被认为是由输入组成和目标输出,其中n是数据集中的样本数,d是输入的维数。 目标由输入函数生成 加上附加噪声: 。 这项工作的目的是找到最简单的函数,该函数...
  • 在社会科学中将OLS估计应用于回归模型时,其中的一个假设是同方差,我更喜欢常误差方差。这意味着误差方差没有系统的模式,这意味着该模型在所有预测级别上都同样...计量经济学家已经开发出各种各样的异方差一致...
     
    

    在社会科学中将OLS估计应用于回归模型时,其中的一个假设是同方差,我更喜欢常误差方差。这意味着误差方差没有系统的模式,这意味着该模型在所有预测级别上都同样差。

    异方差性是同方差性的补充,不会使OLS产生偏差。如果您不像社会科学中的大多数人那样关心p值,那么异方差性可能不是问题。

    计量经济学家已经开发出各种各样的异方差一致性标准误差,因此他们可以继续应用OLS,同时调整非恒定误差方差。这些更正的Wikipedia页面列出了这些替代标准错误所使用的许多名称。

    我们提供了似然函数,并且两个函数都将找到使似然最大化的参数估计。

    让我们来看一个简单的例子:

    首先,我从均值3和标准差1.5的正态分布中提取500个观测值,并将其保存到数据集中:

    dat <- data.frame(y = rnorm(n = 500, mean = 3, sd = 1.5))
    

    样本的平均值和标准偏差为:

    mean(dat$y)
    [1] 2.999048
    
    sd(dat$y)
    [1] 1.462059
    

    我也可以这样问这个问题,正态分布,均值和标准差的哪些参数可以最大程度地提高观察到的变量的可能性?

    m.sd <- mle2(y ~ dnorm(mean = a, sd = exp(b)), data = dat,
                 start = list(a = rnorm(1), b = rnorm(1)))
    

    在上面的语法中,R变量y的平均值是一个常数a,而y的标准偏差是一个常数b。标准差取幂,确保它永远不会为负数。我们提供初始值,因此它可以在收敛到使可能性最大化的值之前开始估算。随机数足以满足初始值。

    m.sd
    
    Call:
    mle2(minuslogl = y ~ dnorm(mean = a, sd = exp(b)), start = list(a = rnorm(1),
        b = rnorm(1)), data = dat)
    
    Coefficients:
            a         b
    2.9990478 0.3788449
    
    Log-likelihood: -898.89
    

    系数a非常类似于数据的平均值。必须对系数b取幂,以获得标准偏差:

    exp(coef(m.sd)[2])
           b
    1.460596
    

    这类似于我们上面获得的标准偏差。上面的语法演示的另一个有趣的事实是lm()类似的函数coef()summary()并且可以在mle2()对象上使用。

    我们上面执行的最大似然估计类似于使用OLS估计的仅截距回归模型:

    coef(lm(y ~ 1, dat))
    (Intercept)
       2.999048
    
    sigma(lm(y ~ 1, dat))
    [1] 1.462059
    

    截距是数据的平均值,残留标准偏差是标准偏差。

    异方差回归模型

    考虑以下研究。我们分配了两组,一个是治疗组,一个是30个人,另一个是对照组,每个是100个人,与治疗组相匹配的是决定结果的协变量。因此,我们对治疗效果感兴趣,并让我们假设一个简单的均值差就足够了。碰巧,这种治疗方法除了有效之外,还具有均质作用,例如,受试者被洗脑后对结果的改善更好。以下数据集应符合上述方案:

    
    

    有100名参与者的治疗状态为0(对照组),平均值为0,标准差为1。有30名参与者的治疗状态为1(治疗组),平均值为0.3,标准值为1,偏差0.25。

    这种情况显然违反了同方差假设,但是,我们继续对治疗效果进行OLS估计:

    
    Call:
    
    Residuals:
        Min      1Q  Median      3Q     Max
    -2.8734 -0.5055 -0.0287  0.4231  3.4097
    
    Coefficients:
                Estimate Std. Error t value Pr(>|t|)
    (Intercept)  0.03386    0.09298   0.364    0.716
    treat        0.21733    0.19355   1.123    0.264
    
    Residual standard error: 0.9298 on 128 degrees of freedom
    Multiple R-squared:  0.009754,	Adjusted R-squared:  0.002018
    F-statistic: 1.261 on 1 and 128 DF,  p-value: 0.2636
    

    治疗效果为0.22,无统计学意义,p = 0.26p=.26在一个αα的.05级。但是我们知道方差不是同方差的,因为我们创建了数据,并且残差对拟合值的简单诊断图证实了这一点:

    
    

    0分

    首先,我记录一下重新创建OLS模型:

    
    

    在此函数中,我为结果的平均值创建一个模型,该模型是截距的函数b_int,以及治疗预测因子的系数b_treat。标准偏差还是一个指数常数。该模型将等效于线性模型。

    但是,我们知道方差不是恒定的,而是两组不同。我们可以将标准偏差指定为组的函数:

    
    

    在此,我们为标准差指定了一个模型,该模型作为截距的函数s_int,代表控制组,并且与该截距的偏差为s_treat

    我们可以做得更好。我们可以利用系数从OLS模型作为初始值b_intb_treat。运行模型:

    
    
    Maximum likelihood estimation
    
    Call:
    (minuslogl = y ~ dnorm(mean = b_int + b_treat * treat, sd = exp(s_int +
        s_treat * treat)), start = list(b_int = coef(m.ols)[1], b_treat = coef(m.ols)[2],
        s_int = rnorm(1), s_treat = rnorm(1)))
    
    Coefficients:
             Estimate Std. Error  z value   Pr(z)    
    b_int    0.033862   0.104470   0.3241 0.74584    
    b_treat  0.217334   0.112249   1.9362 0.05285 .  
    s_int    0.043731   0.070711   0.6184 0.53628    
    s_treat -1.535894   0.147196 -10.4344 < 2e-16 ***
    ---
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
    
    -2 log L: 288.1408
    

    治疗效果大致相同,但现在p值为.053。远小于假设为纯正方差分析的0.26。b_treat变量的精度要高得多,因为此处的标准误差.11小于.19。

    标准差模型建议标准差为:

    exp(coef(m.het)[3])
    
       s_int
    1.044701
    

    对照组和1.045:

    exp(coef(m.het)[3] + coef(m.het)[4])
    
        s_int
    0.2248858
    

    .22为治疗组。这些值接近我们所知道的模拟值。我们可以确认样本统计数据为:

    
      treat         y
    1     0 1.0499657
    2     1 0.2287307
    

    在没有异方差且允许异方差的情况下,也可以轻松地对模型进行模型比较:

    
    Likelihood Ratio Tests
    Model 1: m.mle, y~dnorm(mean=b_int+b_treat*treat,sd=exp(s1))
    Model 2: m.het, y~dnorm(mean=b_int+b_treat*treat,sd=exp(s_int+s_treat*treat))
      Tot Df Deviance  Chisq Df Pr(>Chisq)    
    1      3   347.98                         
    2      4   288.14 59.841  1  1.028e-14 ***
    ---
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
    

    似然比测试建议我们改进了模型,χ 2(1 )= 59.81 ,p < 0.001χ2(1个)=59.81,p<.001。

    因此,我们可以确认在此单个示例中对方差建模可以提高精度。当影响为零并且我们具有异方差性时,很容易编写一个将异方差MLE与OLS估计进行比较的仿真代码。

    我从上面对代码进行了更改,方法是给治疗组的平均值为零,以使两组之间没有均值差。我重复了该过程500次,从OLS及其p值中节省了治疗效果,从异方差MLE及其p值中节省了治疗效果。

    然后,我绘制结果:

    
    par(mfrow = c(1, 1))
    

    1级

    OLS和异方差性MLE的治疗效果相似。但是,当null为true时,异方差MLE模型的p值表现得更好。如果null为true,则可以期望p值均匀分布。OLS迭代的p值堆叠在高端。

    这次,我重复此过程,使治疗组的平均值为0.15,因此零效果的null假设为假。 

    2级

    治疗效果再次具有相同的分布。然而,与OLS相比,异方差MLE的p值要小得多,异方差MLE具有更大的统计功效来检测治疗效果。


    首先,为负对数可能性指定一个函数,然后将此函数传递给MLE。

    
    (minuslogl = ll, start = list(b_int = rnorm(1), b_treat = rnorm(1),
        s_int = rnorm(1), s_treat = rnorm(1)))
    
    Coefficients:
             Estimate Std. Error  z value   Pr(z)    
    b_int    0.033862   0.104470   0.3241 0.74584    
    b_treat  0.217334   0.112249   1.9362 0.05285 .  
    s_int    0.043733   0.070711   0.6185 0.53626    
    s_treat -1.535893   0.147196 -10.4343 < 2e-16 ***
    ---
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
    
    -2 log L: 288.1408
    

    
    Family: gaussian  ( identity )
    Formula:          y ~ treat
    Dispersion:         ~treat
    Data: dat
    
        AIC      BIC   logLik deviance df.resid
      296.1    307.6   -144.1    288.1      126
    
    
    Conditional model:
               Estimate Std. Error z value Pr(>|z|)  
    (Intercept)  0.03386    0.10447   0.324   0.7458  
    treat        0.21733    0.11225   1.936   0.0528 .
    ---
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
    
    Dispersion model:
               Estimate Std. Error z value Pr(>|z|)    
    (Intercept)  0.08746    0.14142   0.618    0.536    
    treat       -3.07179    0.29439 -10.434   <2e-16 ***
    ---
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
    

    在这种情况下,离散度在对数方差的范围内,因此必须取平方的指数对数方差平方根才能检索上述的组标准差。

    展开全文
  • 文章目录异方差@[toc]1 异方差的一些例子2 什么是异方差3异方差产生的原因4 异方差后果5 如何识别异方差5.1 图示法5.2 哥德菲尔德-夸特检验5.3 怀特检验5.4 Bp检验(布鲁奇-帕甘)6 补救6.1 使用“OLS + 稳健标准误...

    异方差

    1 异方差的一些例子

    • 在消费函数,不同收入群体,消费的波动差距是否相同?
      C i = α + β Y i + ε i C_i = \alpha + \beta Y_i + \varepsilon_i Ci=α+βYi+εi

    • 在企业成本函数,大企业与小企业规模经济存在差异

    • 股票收益率数据也可能出现条件异方差ARCH 模型情形。


    2 什么是异方差

    经典线性回归方程
    y = β X + ε y = \boldsymbol \beta \boldsymbol X +\boldsymbol \varepsilon y=βX+ε
    普通最小二乘(OLS)估计量
    β ^ o l s = ( X ′ X ) − 1 X ′ Y = ( X ′ X ) − 1 X ′ ( β X + ε ) = β + ( X ′ X ) − 1 X ′ ε \hat {\boldsymbol \beta}_{ols} = (X'X)^{-1}X'Y = (X'X)^{-1}X'(\boldsymbol \beta \boldsymbol X+\varepsilon) = \boldsymbol \beta+(X'X)^{-1}X'\varepsilon β^ols=(XX)1XY=(XX)1X(βX+ε)=β+(XX)1Xε
    其方差协方差矩阵:
    V a r − C o v ( β ^ ) = E ( β ^ − E ( β ^ ) ( β ^ − E ( β ^ ) ′ ) = E ( ( X ′ X ) − 1 X ′ ε ε ′ X ( X ′ X ) − 1 ) = ( X ′ X ) − 1 X ′ E ( ε ε ′ ) X ( X ′ X ) − 1 \begin{aligned} Var-Cov(\hat \beta) & = E(\hat \beta-E(\hat \beta)(\hat \beta-E(\hat \beta)')\\ &=E((X'X)^{-1}X'\varepsilon \varepsilon'X (X'X)^{-1})\\ & = (X'X)^{-1}X'E(\varepsilon \varepsilon')X (X'X)^{-1} \end{aligned} VarCov(β^)=E(β^E(β^)(β^E(β^))=E((XX)1XεεX(XX)1)=(XX)1XE(εε)X(XX)1
    在同方差假设下:
    E ( ε ε ’ ) = σ 2 I = [ σ 2 0 ⋯ 0 0 σ 2 ⋯ 0 ⋮ ⋮ ⋮ 0 0 ⋯ σ 2 ] E(\varepsilon \varepsilon’)= \sigma^2I = \left[\begin{array}{cccc} \sigma^2 & 0 &\cdots&0\\ 0 & \sigma^2 &\cdots&0\\ \vdots & \vdots & &\vdots\\ 0 & 0 &\cdots &\sigma^2 \end{array}\right] E(εε)=σ2I=σ2000σ2000σ2
    于是
    V a r − C o v ( β ^ ) = σ 2 ( X ′ X ) − 1 Var-Cov(\hat \beta) = \sigma^2(X'X)^{-1} VarCov(β^)=σ2(XX)1

    在实际建模中,扰动项的方差并不是
    V a r ( ε ) = σ i 2 f ( X ) Var(\varepsilon) = \sigma_i^2f(X) Var(ε)=σi2f(X)


    3异方差产生的原因

    • OLS假设条件苛刻:球形扰动项

    • 模型设定偏误,导致非线性的变量遗漏

    • 知道但无法获取的特征变量的遗漏变,增加了扰动项的波动性

    例如,设真实模型:
    y = a + b x 1 + c x 2 + u y = a + bx_1 + cx_2+u y=a+bx1+cx2+u
    由于遗漏了变量 x 2 x_2 x2,实际建模为:
    y = a + b x 1 + v ; v = c x 2 + u y = a + bx_1+v;v = cx_2+u y=a+bx1+v;v=cx2+u
    此时新的扰动项 v v v的方差为:
    V a r ( v ) = C o v ( c x 2 + u , c x 2 + u ) = c 2 σ x 2 + σ u 2 > σ u 2 Var (v) = Cov(cx_2+u,cx_2+u) = c^2\sigma_x^2+\sigma_u^2>\sigma_u^2 Var(v)=Cov(cx2+u,cx2+u)=c2σx2+σu2>σu2

    1. 模型设定误差模型为非线性模型,但却设定为线性模式(库兹涅茨效应)

    2. 变量选择:变量的测度不准确,被解释变量 y y y,与解释变量 x x x的观测误差导致方差增大


    4 异方差后果

    (1)参数无偏性不受影响

    E ( β ^ ) = β E(\hat \beta) = \beta E(β^)=β

    证明:
    β ^ o l s = β + ( X ′ X ) − 1 X ′ ε \hat {\boldsymbol \beta}_{ols} = \boldsymbol \beta+(X'X)^{-1}X'\varepsilon β^ols=β+(XX)1Xε

    E ( β ^ ) = E ( β + ( X ′ X ) − 1 X ′ ε ) = β E(\hat \beta) =E( \boldsymbol \beta+(X'X)^{-1}X'\varepsilon) = \beta E(β^)=E(β+(XX)1Xε)=β
    (2)有效性降低
    存在异方差时,球形扰动假设不能满足,参数OLS估计量的方差不再是最小的方差。有效性定义为
    V a r ( β ^ ∗ ) ≤ V a r ( β ′ ) , ∀ β ′ Var(\hat \beta^{*}) \le Var(\beta^{\prime}),\forall \beta^{'} Var(β^)Var(β),β
    则说 β ^ ∗ \hat{\beta}^{*} β^在对应的估计方法下,其参数估计量具有有效性。在球形扰动条件下,OLS的方差最有效,反之,不满足球形扰动就不是最有效。根据一元线性回归方程公式
    V a r ( β ^ ) = σ 2 Σ x i 2 ; t = β ^ V a r ( β ^ ) Var(\hat\beta) = \frac{\sigma^2}{\Sigma x_i^2};t = \frac{\hat\beta}{\sqrt{Var(\hat\beta) }} Var(β^)=Σxi2σ2;t=Var(β^) β^
    (3)对系数显著性影响

    O L S OLS OLS经典回归模型中,估计量 β o l s \beta_{ols} βols是最佳有效线性估计量,因此其方差是所有估计量中最小方差。异方差则不是最小方差,从而导致统计量 t t t变小,容易扭曲系数的显著性:本应该显著的回归系数因为异方差原因低估了回归系数的显著性。

    (4)对假设检验影响

    • 系数检验t检验:一元线性回归为例, V a r ( β ^ ) ≠ σ 2 / Σ x i 2 Var(\hat\beta) \ne \sigma^2/\Sigma x_i^2 Var(β^)=σ2/Σxi2,从而 t t t统计量不是真实的统计量,影响系数显著性。
    • 方程显著性检验F统计量:

    5 如何识别异方差

    5.1 图示法

    • 画相关散点图
      横轴为考察的自变量 x x x,纵轴为被解释变量 y y y,画出二者散点图。在 x x x条件下 y y y的变化的波动存在较大差异

    • 残差图:
      先利用OLS回归得到回归模型的的残差值 e e e,画 e e e与自变量 x x x的散点图,当 e e e随着 x x x变化存在明显的变化趋势时,可经验判断具有异方差

    5.2 哥德菲尔德-夸特检验

    前置条件

    • 此检验只适用于大样本
    • 仅解决同方差不成立情形

    step1: 将解释变量按照从小到达顺序排序

    step2: 排列在中间的 C C C个(约1/4)的观察值删除掉,再将剩余的观测值分为两个部分,每部分观察值的个数为 ( n − c ) / 2 (n-c)/2 (nc)/2

    step3: 提出假设。即 : H 0 H_0 H0两部分数据的方差相等; H 1 H_1 H1两部分数据的方差不相等

    step4: 构造F统计量。分别对上述两个部分的观察值作回归,由此得到的两个部分的残差平方和 Σ e 1 i 2 \Sigma e_{1i}^2 Σe1i2 Σ e 2 i 2 \Sigma e_{2i}^2 Σe2i2,自由度均为 ( n − c ) / 2 − k (n-c)/2-k (nc)/2k

    step5: 在原假设条件下,构造统计量
    F ⋆ = ∑ e 2 i 2 / [ n − c 2 − k ] ∑ e 1 i 2 / [ n − c 2 − k ] = ∑ e 2 i 2 ∑ e 1 i 2 ∼ F ( n − c 2 − k , n − c 2 − k ) F^{\star}=\frac{\sum e_{2 i}^{2} /\left[\frac{n-c}{2}-k\right]}{\sum e_{1 i}^{2} /\left[\frac{n-c}{2}-k\right]}=\frac{\sum e_{2 i}^{2}}{\sum e_{1 i}^{2}} \sim F\left(\frac{n-c}{2}-k, \frac{n-c}{2}-k\right) F=e1i2/[2nck]e2i2/[2nck]=e1i2e2i2F(2nck,2nck)
    step6: 判断。若 F ⋆ > F ( n − c 2 − k , n − c 2 − k ) F^{\star}>F\left(\frac{n-c}{2}-k, \frac{n-c}{2}-k\right) F>F(2nck,2nck),则拒绝原假设,存在异方差

    局限性:前半部分与后半部分同方差,而中间可能部分存在异方差


    5.3 怀特检验

    σ i 2 = σ 2 f ( X i ) \sigma_i^2 = \sigma^2f(X_i) σi2=σ2f(Xi)
    表明扰动项方差关于自变量 X X X的函数,那么用扰动项对 X X X求回归,以判断哪些自变量对方差产生显著的影响。由于总体数据无法获取,因此利用样本数据回归得到的残差平方和 e i 2 e_i^2 ei2对自变量 X X X进行 O L S OLS OLS回归.例如
    y = b ^ 0 + b ^ 1 x 1 + b ^ 2 x 2 + e y = \hat b_0 +\hat b_1 x_1+\hat b_2x_2+e y=b^0+b^1x1+b^2x2+e
    得到残差:
    e = y − y ^ e = y - \hat y e=yy^
    再构造辅助回归:
    e i 2 = a 0 + a 1 x 1 + a 2 x 2 + a 3 x 1 2 + a 4 x 4 2 + a 5 x 1 x 2 + v e_i^2 = a_0+a_1x_1+a_2x_2+a_3x_1^2+a_4x_4^2+a_5x_1x_2+v ei2=a0+a1x1+a2x2+a3x12+a4x42+a5x1x2+v
    R 2 R^2 R2为辅助回归可决系数。在原假设: H 0 : α i ( i = 1 , 3 , … … 5 ) = 0 H_0:\alpha_i(i= 1,3,……5)= 0 H0:αi(i=1,3,5)=0成立条件下,计算统计量 n R 2 nR^2 nR2,其中 n n n为样本,进行比较,若
    n R 2 > χ 2 ( 5 ) nR^2 > \chi^2(5) nR2>χ2(5)
    则拒绝原假设,存在异方差。原假设:
    H 0 : E ( ε i 2 ∣ x 2 , ⋯   , x K ) = σ 2 H_{0}: \mathrm{E}\left(\varepsilon_{i}^{2} \mid x_{2}, \cdots, x_{K}\right)=\sigma^{2} H0:E(εi2x2,,xK)=σ2
    u ^ 2 = δ 0 + ∑ j = 1 k δ j x j + ∑ j = 1 k ∑ p = j k δ j p x j x p + v \hat{u}^{2}=\delta_{0}+\sum_{j=1}^{k} \delta_{j} x_{j}+\sum_{j=1}^{k} \sum_{p=j}^{k} \delta_{j p} x_{j} x_{p}+v u^2=δ0+j=1kδjxj+j=1kp=jkδjpxjxp+v
    L M = n R u 2 ∼ χ k ( k + 1 ) / 2 + k 2 L M=n R_{u}^{2} \sim \chi_{k(k+1) / 2+k}^{2} LM=nRu2χk(k+1)/2+k2

    评价:可以检验任何形式的异方差;缺点:如果 H 0 H_0 H0被拒绝,并不提供有关异方差具体形式的信息。


    5.4 Bp检验(布鲁奇-帕甘)

    构造辅助回归
    e i 2 = a 0 + a 1 x 1 + a 2 x 2 + e r r o e_i^2 = a_0+a_1x_1+a_2x_2+erro ei2=a0+a1x1+a2x2+erro
    使用 n R 2 nR^2 nR2统计量:
    n R 2 ⟶ d χ 2 ( K − 1 ) n R^{2} \stackrel{d}{\longrightarrow} \chi^{2}(K-1) nR2dχ2(K1)
    BP 检验的优点在于其建设性,可帮助确认异方差的具体形式。但不含二次项形式。或者一种更简练的节省自由度的方法:
    e i 2 = a + b y ^ i + e r r o e_i^2 = a + b\hat y_i+erro ei2=a+by^i+erro
    e i 2 = a + b y ^ i + c y ^ 2 + e r r o e_i^2 = a + b\hat y_i+c \hat y^2+erro ei2=a+by^i+cy^2+erro


    6 补救

    6.1 使用“OLS + 稳健标准误”

    这是最简单,也是目前通用的方法。只要样本容量较大,即使在异方差的情况下,若使用稳健标准误,则所有参数估计、假设检验均可照常进行。ols回归系数方差公式
    Cov ⁡ ( β ^ ∣ x ) = ( x ′ x ) − 1 x ′ E ( u u ′ ∣ x ) x ( x ′ x ) − 1 \operatorname{Cov}(\hat{\beta} \mid x)=\left(x^{\prime} x\right)^{-1} x^{\prime} \mathrm{E}\left(u u^{\prime} \mid x\right) x\left(x^{\prime} x\right)^{-1} Cov(β^x)=(xx)1xE(uux)x(xx)1
    异方差稳健方差:
    Cov ⁡ ^ ( β ^ ∣ x ) = ( x ′ x ) − 1 ( ∑ u ^ i 2 x i ′ x i ) ( x ′ x ) − 1 \widehat{\operatorname{Cov}}(\hat{\beta} \mid x)=\left(x^{\prime} x\right)^{-1}\left(\sum \hat{u}_{i}^{2} x_{i}^{\prime} x_{i}\right)\left(x^{\prime} x\right)^{-1} Cov (β^x)=(xx)1(u^i2xixi)(xx)1
    聚类稳健标准方差:
    Cov ⁡ ^ ( β ^ ∣ x ) = ( x ′ x ) − 1 ( ∑ g = 1 G x g ′ u ^ g ′ u ^ g x g ) ( x ′ x ) − 1 \widehat{\operatorname{Cov}}(\hat{\beta} \mid x)=\left(x^{\prime} x\right)^{-1}\left(\sum_{g=1}^{G} x_{g}^{\prime} \hat{u}_{g}^{\prime} \hat{u}_{g} x_{g}\right)\left(x^{\prime} x\right)^{-1} Cov (β^x)=(xx)1(g=1Gxgu^gu^gxg)(xx)1


    6.2 广义最小二乘法 GLS

    假设 Var ⁡ ( ε ∣ X ) = E ( ε ε ′ ∣ X ) = σ 2 V ( X ) ≠ σ 2 I n \operatorname{Var}(\varepsilon \mid \boldsymbol{X})=E(\varepsilon\varepsilon'|X)=\sigma^{2} \boldsymbol{V}(\boldsymbol{X}) \neq \sigma^{2} \boldsymbol{I}_{n} Var(εX)=E(εεX)=σ2V(X)=σ2In,且 V ( X ) \boldsymbol{V}(\boldsymbol{X}) V(X)正定对称且已知,基本思想:通过变量转换,使得转换后的模型满足球型扰动项的假定。

    定理:对于任意正定对称矩阵 V n × n \boldsymbol{V}_{n\times n} Vn×n,存在非退化矩阵 C n × n \boldsymbol{C}_{n\times n} Cn×n,使得 V − 1 = C ′ C \boldsymbol {V}^{-1} = \boldsymbol {C}^{\prime}\boldsymbol{C} V1=CC。矩阵 C \boldsymbol C C不唯一,但不影响最终结果

    设回归模型
    y = X β + ε y=X \beta+\varepsilon y=Xβ+ε
    两边同时左乘矩阵 C C C得:
    C y = C X β + C ε C y=C X \beta+C \varepsilon Cy=CXβ+Cε
    定义变量转换:
    y ~ ≡ C y , X ~ ≡ C X , ε ~ ≡ C ε \tilde{y} \equiv C y, \tilde{X} \equiv C X, \tilde{\varepsilon} \equiv C \varepsilon y~Cy,X~CX,ε~Cε
    可将模型写为:
    y ~ = X ~ β + ε ~ \tilde{y}=\tilde{X} \beta+\tilde{\varepsilon} y~=X~β+ε~
    变换后的模型仍满足严格外生性:
    E ( ε ~ ∣ X ~ ) = E ( C ε ∣ C X ) = E ( C ε ∣ X ) = C E ( ε ∣ X ) = 0 \mathrm{E}(\tilde{\boldsymbol{\varepsilon}} \mid \tilde{\boldsymbol{X}})=\mathrm{E}(\boldsymbol{C} \boldsymbol{\varepsilon} \mid \boldsymbol{C X})=\mathrm{E}(\boldsymbol{C} \boldsymbol{\varepsilon} \mid \boldsymbol{X})=\boldsymbol{C} \mathrm{E}(\boldsymbol{\varepsilon} \mid \boldsymbol{X})=\boldsymbol{0} E(ε~X~)=E(CεCX)=E(CεX)=CE(εX)=0
    球型扰动项的假定也得到满足:
    Var ⁡ ( ε ~ ∣ X ~ ) = E ( ε ~ ε ~ ′ ∣ X ) = E ( C ε ε ′ C ′ ∣ X ) = C E ( ε ε ′ ∣ X ) C ′ = σ 2 C V C ′ = σ 2 C ( V − 1 ) − 1 C ′ = σ 2 C ( C ′ C ) − 1 C ′ = σ 2 C C − 1 ( C ′ ) − 1 C ′ = σ 2 I n \begin{aligned} \operatorname{Var}(\tilde{\varepsilon} \mid \tilde{\boldsymbol{X}}) &=\mathrm{E}\left(\tilde{\varepsilon} \tilde{\boldsymbol{\varepsilon}}^{\prime} \mid \boldsymbol{X}\right)=\mathrm{E}\left(\boldsymbol{C} \boldsymbol{\varepsilon} \boldsymbol{\varepsilon}^{\prime} \boldsymbol{C}^{\prime} \mid \boldsymbol{X}\right)=\boldsymbol{C} \mathrm{E}\left(\boldsymbol{\varepsilon} \boldsymbol{\varepsilon}^{\prime} \mid \boldsymbol{X}\right) \boldsymbol{C}^{\prime}=\sigma^{2} \boldsymbol{C} \boldsymbol{V} \boldsymbol{C}^{\prime} \\ &=\sigma^{2} \boldsymbol{C}\left(\boldsymbol{V}^{-1}\right)^{-1} \boldsymbol{C}^{\prime}=\sigma^{2} \boldsymbol{C}\left(\boldsymbol{C}^{\prime} \boldsymbol{C}\right)^{-1} \boldsymbol{C}^{\prime}=\sigma^{2} \boldsymbol{C} \boldsymbol{C}^{-1}\left(\boldsymbol{C}^{\prime}\right)^{-1} \boldsymbol{C}^{\prime}=\sigma^{2} \boldsymbol{I}_{n} \end{aligned} Var(ε~X~)=E(ε~ε~X)=E(CεεCX)=CE(εεX)C=σ2CVC=σ2C(V1)1C=σ2C(CC)1C=σ2CC1(C)1C=σ2In
    故高斯-马尔可夫定理成立。对变换后的模型使用 OLS 即得到GLS 估计量:
    β ^ G L S = ( X ~ ′ X ~ ) − 1 X ~ ′ y ~ = [ ( C X ) ′ ( C X ) ] − 1 ( C X ) ′ C y = ( X ′ C ′ C X ) − 1 X ′ C ′ C y = ( X ′ V − 1 X ) − 1 X ′ V − 1 y \begin{aligned} \hat{\beta}_{\mathrm{GLS}} &=\left(\tilde{\boldsymbol{X}}^{\prime} \tilde{\boldsymbol{X}}\right)^{-1} \tilde{\boldsymbol{X}}^{\prime} \tilde{\boldsymbol{y}}=\left[(\boldsymbol{C X})^{\prime}(\boldsymbol{C X})\right]^{-1}(\boldsymbol{C X})^{\prime} \boldsymbol{C} \boldsymbol{y} \\ &=\left(\boldsymbol{X}^{\prime} \boldsymbol{C}^{\prime} \boldsymbol{C} \boldsymbol{X}\right)^{-1} \boldsymbol{X}^{\prime} \boldsymbol{C}^{\prime} \boldsymbol{C} \boldsymbol{y}=\left(\boldsymbol{X}^{\prime} \boldsymbol{V}^{-1} \boldsymbol{X}\right)^{-1} \boldsymbol{X}^{\prime} \boldsymbol{V}^{-1} \boldsymbol{y} \end{aligned} β^GLS=(X~X~)1X~y~=[(CX)(CX)]1(CX)Cy=(XCCX)1XCCy=(XV1X)1XV1y
    虽然 C C C不唯一,但 β ^ \hat{\beta} β^唯一。显然 β ^ G L S \hat{\beta}_{\mathrm{GLS}} β^GLS是是BLUE,比OLS 更有效。但前提是必须知道协方差矩 V V V


    6.3 加权最小二乘法WLS

    假设仅存在异方差,无自相关, V n × n \boldsymbol{V}_{n\times n} Vn×n为对角阵。方差小的数据提供的信息量大。WLS 根据信息量大小进行加权。假定
    E ( ε i 2 ∣ x i ) = Var ⁡ ( ε i ∣ x i ) = σ 2 v i ( X ) \mathrm{E}\left(\varepsilon_{i}^{2} \mid \boldsymbol{x}_{i}\right)=\operatorname{Var}\left(\varepsilon_{i} \mid \boldsymbol{x}_{i}\right)=\sigma^{2} v_{i}(\boldsymbol{X}) E(εi2xi)=Var(εixi)=σ2vi(X)
    其中
    V = ( v 1 0 v 2 ⋱ 0 v n ) , V − 1 = ( 1 / v 1 0 1 / v 2 ⋱ 0 1 / v n ) \boldsymbol{V}=\left(\begin{array}{ccc} v_{1} & & 0 \\ & v_{2} & & \\ & & \ddots & \\ 0 & & & v_{n} \end{array}\right), \quad \boldsymbol{V}^{-1}=\left(\begin{array}{cccc} 1 / v_{1} & & & 0 \\ & 1 / v_{2} & & \\ & & \ddots & \\ 0 & & & 1 / v_{n} \end{array}\right) V=v10v20vn,V1=1/v101/v201/vn
    因为 V − 1 = C ′ C \boldsymbol {V}^{-1} = \boldsymbol {C}^{\prime}\boldsymbol{C} V1=CC
    C = C ′ = ( 1 / v 1 0 1 / v 2 ⋱ 0 1 / v n ) \boldsymbol{C}=\boldsymbol{C}^{\prime}=\left(\begin{array}{cccc} 1 / \sqrt{v_{1}} & & & 0 \\ & 1 / \sqrt{v_{2}} & & \\ & & \ddots & \\ 0 & & & 1 / \sqrt{v_{n}} \end{array}\right) C=C=1/v1 01/v2 01/vn

    y ~ ≡ C y = ( 1 / v 1 0 1 / v 2 ⋱ 0 1 v n ) ( y 1 y 2 ⋮ y n ) = ( y 1 / v 1 y 2 / v 2 ⋮ y n / v n ) \tilde{\boldsymbol{y}} \equiv \boldsymbol{C} \boldsymbol{y}=\left(\begin{array}{cccc} 1 / \sqrt{v_{1}} & & & 0 \\ & 1 / \sqrt{v_{2}} & & \\ & & \ddots & \\ 0 & & & 1 & \sqrt{v_{n}} \end{array}\right)\left(\begin{array}{c} y_{1} \\ y_{2} \\ \vdots \\ y_{n} \end{array}\right)=\left(\begin{array}{c} y_{1} / \sqrt{v_{1}} \\ y_{2} / \sqrt{v_{2}} \\ \vdots \\ y_{n} / \sqrt{v_{n}} \end{array}\right) y~Cy=1/v1 01/v2 01vn y1y2yn=y1/v1 y2/v2 yn/vn

    其中
    X ~ ≡ C X = ( 1 / v 1 0 1 / v 2 ⋱ 0 1 / v n ) ( x 11 … x 1 K x 21 … x 2 K ⋮ ⋮ x n 1 … x n K ) = ( x 11 / v 1 … x 1 K / v 1 x 21 / v 2 … x 2 K / v 2 ⋮ ⋮ x n 1 / v n … x n K ) \begin{aligned} \tilde{\boldsymbol{X}} \equiv \boldsymbol{C X} &=\left(\begin{array}{cccc} 1 / \sqrt{v_{1}} & & & 0 \\ & 1 / \sqrt{v_{2}} & & \\ & & \ddots & \\ 0 & & & 1 / \sqrt{v_{n}} \end{array}\right)\left(\begin{array}{ccc} x_{11} & \ldots & x_{1 K} \\ x_{21} & \ldots & x_{2 K} \\ \vdots & & \vdots \\ x_{n 1} & \ldots & x_{n K} \end{array}\right) \\ \\ &=\left(\begin{array}{ccc} x_{11} / \sqrt{v_{1}} & \ldots & x_{1 K} / \sqrt{v_{1}} \\ x_{21} / \sqrt{v_{2}} & \ldots & x_{2 K} / \sqrt{v_{2}} \\ \vdots & & \vdots \\ x_{n 1} / \sqrt{v_{n}} & \ldots & x_{n K} \end{array}\right) \end{aligned} X~CX=1/v1 01/v2 01/vn x11x21xn1x1Kx2KxnK=x11/v1 x21/v2 xn1/vn x1K/v1 x2K/v2 xnK
    其中权重 1 / v i 1/\sqrt{v_i} 1/vi 表示标准差的倒数,第 i i i个观测的回归方程为:
    y i v i = β 1 x i 1 v i + β 2 x i 2 v i + ⋯ + β K x i K v i + ε i v i \frac{y_{i}}{\sqrt{v_{i}}}=\beta_{1} \frac{x_{i 1}}{\sqrt{v_{i}}}+\beta_{2} \frac{x_{i 2}}{\sqrt{v_{i}}}+\cdots+\beta_{K} \frac{x_{i K}}{\sqrt{v_{i}}}+\frac{\varepsilon_{i}}{\sqrt{v_{i}}} vi yi=β1vi xi1+β2vi xi2++βKvi xiK+vi εi
    新扰动项为 ε i / v i \varepsilon_{i} / \sqrt{v_{i}} εi/vi ,可将WLS视为最小化“加权的残差平方和:
    min ⁡ β ⃗ S S R = ∑ i = 1 n ( e i / v i ) 2 = ∑ i = 1 n e i 2 v i \min _{\vec{\beta}} \mathrm{SSR}=\sum_{i=1}^{n}\left(e_{i} / \sqrt{v_{i}}\right)^{2}=\sum_{i=1}^{n} \frac{e_{i}^{2}}{v_{i}} β minSSR=i=1n(ei/vi )2=i=1nviei2
    权重为 1 / v i 1/v_i 1/vi


    6.4 可行广义最小二乘法FGLS

    必须先用样本数据估计 V n × n \boldsymbol{V}_{n\times n} Vn×n然后才能使用GLS,故称为 FGLS或“可行加权最小二乘法”(Feasible WLS,简记FWLS),即
    β ^ F G L S = ( X ′ V ^ − 1 X ) − 1 X ′ V ^ − 1 y \hat{\beta}_{\mathrm{FGLS}}=\left(\boldsymbol{X}^{\prime} \hat{V}^{-1} \boldsymbol{X}\right)^{-1} \boldsymbol{X}^{\prime} \hat{V}^{-1} \boldsymbol{y} β^FGLS=(XV^1X)1XV^1y
    其中 V ^ \hat{V} V^ V {V} V的一致估计量。 V ( X ) {V}(X) V(X)包含过多参数,实践中,常考虑只有异方差,或只有一阶自相关的情形。以FWLS 为例。在作BP 检验时, 通过辅助回归(此处及其谨慎,为什么就假定为线性形式?一旦设定错误会有什么影响)
    e i 2 = δ 1 + δ 2 x i 2 + ⋯ + δ K x i K +  error  i e_{i}^{2}=\delta_{1}+\delta_{2} x_{i 2}+\cdots+\delta_{K} x_{i K}+\text { error }_{i} ei2=δ1+δ2xi2++δKxiK+ error i
    就可获得 σ i 2 \sigma_i^2 σi2的估计值 σ ^ i 2 \hat \sigma_i^2 σ^i2。为保证 σ ^ i 2 \hat \sigma_i^2 σ^i2为正数,假设辅助回归为指数函数的形式:
    e i 2 = σ 2 exp ⁡ ( δ 1 + δ 2 x i 2 + ⋯ + δ K x i K ) v i e_{i}^{2}=\sigma^{2} \exp \left(\delta_{1}+\delta_{2} x_{i 2}+\cdots+\delta_{K} x_{i K}\right) v_{i} ei2=σ2exp(δ1+δ2xi2++δKxiK)vi
    其中 v i v_i vi表示乘积形式扰动项,取对数后可得
    ln ⁡ e i 2 = ( ln ⁡ σ 2 + δ 1 ) + δ 2 x i 2 + ⋯ + δ K x i K + ln ⁡ v i \ln e_{i}^{2}=\left(\ln \sigma^{2}+\delta_{1}\right)+\delta_{2} x_{i 2}+\cdots+\delta_{K} x_{i K}+\ln v_{i} lnei2=(lnσ2+δ1)+δ2xi2++δKxiK+lnvi
    得到 ln ⁡ e i 2 \ln e_{i}^{2} lnei2的预测值 ln ⁡ σ ^ i 2 \ln \hat\sigma_i^2 lnσ^i2,进而得到拟合值 σ ^ i 2 = e ln ⁡ σ ^ i 2 \hat{\sigma}_{i}^{2}=e^{\ln \hat{\sigma}_{i}^{2}} σ^i2=elnσ^i2,然后以 1 / σ ^ i 2 1/\hat{\sigma}_{i}^{2} 1/σ^i2作为权重,进行WLS


    参考文献

    庞皓.计量经济学(第三版),北京:科学出版社114-125,2014
    陈强.高级计量经济学及 Stata 应用(第二版,第 7章 )北京:高等教育出版社,2014。


    更多内容,关注公众号“那由他的学习笔记”

    -END-
    展开全文
  • 为了克服样本中模型选择的缺点,本研究采用样本外模型选择方法来选择具有改进的预测准确性和性能的模型。 从2006年1月3日至2016年12月30日,在尼日利亚证券交易所上市的钻石银行和富达银行获得了每日收盘价。...
  • 多重共线性使参数估计值的方差增大,1/(1-r2)为方差膨胀因子(Variance Inflation Factor, VIF)如果方差膨胀因子值越大,说明共线性越强。相反 因为,容许度是方差膨胀因子的倒数,所以,容许度越小,共线性越强。...
  • TESTHET 测试异方差是否会影响数据。 需要“regstats”和“chi2cdf”(统计TB)。 PVAL = TESTHET(RES, X, WHICHTEST, YHAT) 输入: - Res:通过在 x1、x2 等上回归 Y 获得的残差...(1) 它可以是一个数字 'n×1' ...
  • 计算 Newey-West 调整的异方差序列一致标准误差。 允许选择滞后长度或(默认情况下)根据 Newey-West(1994) 插件程序选择最佳滞后长度。
  • 论文研究-异方差非参数回归模型均值与方差变点的小波估计与应用.pdf, 金融市场中,受突发事件的影响反映资产平均收益的均值函数和反映资产收益波动的方差函数都有可能...
  • 异方差的检验与修正

    千次阅读 2021-05-17 16:40:47
    文章内容: 异方差的性质、产生后果及诊断修正的基本方法。

    1. 异方差的性质

    在这里插入图片描述

    2. 异方差的后果

    异方差违背了高斯马尔科夫的第五条假定(详见“最小二乘原理”一文末)

    1. OLS估计量仍是线性的
    2. OLS估计量仍是无偏
    3. OLS估计量不再具有最小方差性,即无论是小样本还是大样本,OLS估计量都不再是最优线性无偏估计量
    4. OLS估计量的方差通常是有偏的(无统一方差)
    5. 因此,建立在t分布和F分布之上的置信区间和假设检验是不可靠的。(如果沿用传统的假设检验方法,则可能得出错误的结论)

    3.异方差的诊断

    ①残差图

    在这里插入图片描述

    ②帕克检验

    图形检验比较直观。如异方差存在,则其可能与一个或多个解释变量系统相关。为确认这一点,可以做如下回归(以双变量回归模型为例):
    在这里插入图片描述

    ③怀特的一般异方差检验

    在这里插入图片描述

    4. 观察到异方差该怎么办:补救措施

    异方差并不破坏OLS估计量的无偏性,但估计量却不再是有效的,即使对大样本也是如此。失去了有效性,通常的OLS假设检验程序就不再可靠。

    因此,如果怀疑存在异方差或者已经诊断到异方差,寻求补救措施就很重要。

    ①当误差方差已知时:加权最小二乘法

    在这里插入图片描述

    ②当误差方差未知时

    加权最小二乘法简单粗暴,但实际情况中很难获知真实误差方差的信息(即总体信息)。
    因此我们需要对误差方差进行特殊、合理的假设,通过对原始模型变换,使变化后的模型满足同方差假定。

    • 示例情形:误差方差与Xi成比例:平方根变换

    在这里插入图片描述
    类似情形所做措施与之相同

    ③重新设定模型

    例如,如果选择对数形式估计模型,而不是变量线性模型,也可以达到消除异方差的目的。即估计:
    在这里插入图片描述
    变换式中的异方差问题或没那么严重了,因为对数变换压缩了变量的度量规模,把两个变量值间的10倍差异缩小为2倍差异。

    参考书籍:《经济计量学精要》

    展开全文
  • 线性回归模型异方差解决方法1.异方差定义2.异方差检验2.1 残差图2.2 white检验2.3 BP检验3.异方差修正3.1 对原数据做对数处理3.2 使用OLS稳健标准误回归3.3 FWLS回归 1.异方差定义 传说在多元线性回归有这一基本假设...
  • 依据“利用反双曲正弦函数变换提高数据列光滑程度”的结论,给出了两种异方差条件下递增时间序列自回归预测的改善方法.
  • 条件异方差模型

    万次阅读 多人点赞 2017-06-28 21:05:50
    方差齐性变换为异方差序列的精确拟合提供了一种很好的解决方法。但是这种方法只适用部分异方差波动序列。因为要使用方差齐性变换必须事先知道异方差函数的形式,而这不是对所有的序列都可以做到的。实践中,我们只能...
  • 异方差无法用OLS进行估计的根源问题:方差较大的数据包含的信息量较小,但OLS是对所有数据进行相同的处理。 而选用GLS以及WLS进行回归可以对不同特征的数据进行不同的处理以提高估计效率。 异方差的检验 残差图...
  • 异方差性介绍

    2021-09-08 18:23:46
    如在研究城镇居民收入与购买消费品的关系时,用表示第户的收入量,表示第户 的购买量,购买回归模型为: 在此模型中,随机项就具有不用...因而,用随机获取的样本数据建立回归模型,他的随机项就具有异方差性 ...
  • 异方差与R语言实践

    千次阅读 2020-03-23 23:57:22
    文章目录异方差检验之怀特检验举个例子(R语言)异方差处理之加权最小二乘法举个例子(R语言) 异方差检验之怀特检验 在大样本情况下,将OLS估计后的残差平方作为新的被解释变量,常数、解释变量、解释变量的平方以及其...
  • 【零基础Eviews实例】01异方差的检验与修正

    万次阅读 多人点赞 2020-11-29 00:39:11
    使用软件为Eviews,和上一篇文章相同,此处也仅仅关注操作性的东西,即知道怎么判断是否存在异方差,以及如果存在异方差应该怎么做出修正进行说明,对于相关理论部分则并不涉及。 0. 前期准备 以“农村居民恩格尔...
  • 异方差及stata命令

    千次阅读 2021-04-27 22:30:27
    异方差的类型 单调递增类 σi2随X的增大而增大 \sigma^2_i随X的增大而增大 σi2​随X的增大而增大 stata命令 reg lny lnx1 lnx2 #必须先回归才能预测 predict e,residual #预测出e的值即残差的值 gen E=e^2 #生成...
  • 讲讲异方差的检验

    千次阅读 2020-06-20 10:00:43
    总第225篇/张俊红我们前面讲了异方差,也讲了怎么用图示法来判断是否有异方差,这一篇来讲讲怎么用统计的方法来判断有没有异方差。关于检验异方差的统计方法有很多,我们这一节只讲比较普遍且比较...
  • 本文主要介绍异方差性对回归分析的影响,是计量经济学中最常见也是最重要的一种违背基本假设的情况。
  • SPSS异方差检验的实现

    千次阅读 2020-12-25 15:23:13
    SPSS异方差检验的实现 此次介绍两种异方差检验的方法:残差图分析法和等级相关系数法 残差图分析法 当回归模型满足所有假定时,残差图上的n个点的散步应该是随机的,无任何规律。如果回归模型存在异方差性,残差图...
  • 讲讲什么是异方差

    千次阅读 2020-03-07 11:00:00
    总第196篇/张俊红今天我们来讲一下异方差,在异方差以前,我们先讲一下与异方差类似另一个概念:同方差,那同方差又是什么呢?同方差 = 相同 + 方差,顾名思义就是方差相同。那方差又是什么...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 6,092
精华内容 2,436
关键字:

异方差