精华内容
下载资源
问答
  • 标准回归系数
    千次阅读
    2018-05-15 10:15:07

    对于非标准化的系数,数据在未标准化之前是不能直接用来直接比较“重要性大小”的。因为因子本身数据存在差异,看因子重要程度要用标准化系数。

    标准化的回归系数是指将数据标准化(减均值除方差)后计算得到的回归系数。因为数据进行了标准化,因此就取消了量纲的影响。

    假设因变量为y,自变量为x,标准回归系数为a。那么在解释时就要说,当x变化1个标准差是,y变化a个标准差。

    标准化后的回归系数在不同自变量之间是可比的,没有标准化之前是不可比的。

    举一个例子:
    假设因变量是一个人的外貌给人的印象(y),自变量有身高(x1)、体重(x2)
    假如未标准化的回归系数分别为a1、a2。在解释时就要说,在体重不变的前提下,当身高增加1厘米时,y增加a1个单位;在身高不变的前提下,体重(x2)增加1千克,y就增加a2个单位。假设a1>a2,那我们能说身高对一个人的外貌比体重更重要吗?这是不能的,因为身高的1厘米和体重的一厘米对于他们自身来说重要的程度是不一样的。

    必须用标准化的回归系数才能比较,因为那时都是身高或体重增加一个标准差,外貌打分增加多少。这时,身高跟体重都增加了一个标准差,这对于他们自身的重要程度是一样的。

    更多相关内容
  • 标准回归系数引用

    千次阅读 2020-12-20 01:53:15
    5# sungmoo总结两位老师的解答,问题得以解决,举例如下(附do文件及结果):reg y x1-x6 与 reg y x1-x6,beta结果回归系数一样,但前者没有显示标准回归系数,并且后者的标准系数也没有办法贮存在变量或matrix中,这...

    5# sungmoo

    总结两位老师的解答,问题得以解决,举例如下(附do文件及结果):

    reg y x1-x6 与 reg y x1-x6,beta  结果回归系数一样,但前者没有显示标准回归系数,并且后者的标准系数也没有办法贮存在变量或matrix中,这是我比较关心的

    但通过将数据标准化后,reg y x1-x6与reg y x1-x6,beta结果便一样,并且reg y x1-x6,beta中回归系数和标准回归系数是相同的,并且mat a=e(b) 可以引用标准回归系数(实质上我引用的是与标准回归系数相同的回归系数)

    不知对否,请各位老师指正!

    另外我还有一个不会用,比如我想把结果中的每个标准系数存在scalar a1 a2...,不知怎么实现,请老师们指导!

    capture sysuse auto,clear

    drop mpg

    drop rep78

    drop headroom

    drop trunk

    drop turn

    drop foreign

    egen sprice=std(price),mean(0) std(1)

    egen sw=std(weight),mean(0) std(1)

    egen sl=std(length),mean(0) std(1)

    egen sd=std(disp),mean(0) std(1)

    egen sg=std(gear),mean(0) std(1)

    reg  price weight length displacement gear_ratio

    reg  price weight length displacement gear_ratio,beta

    reg  sprice sw sl sd sg,beta

    ereturn list

    mat a=e(b)

    matlist a

    结果如下,

    . reg  price weight length displacement gear_ratio

    Source        SS       df       MS              Number of obs =      74

    F(  4,    69) =   11.04

    Model    247810070     4  61952517.6           Prob > F =  0.0000

    Residual    387255326    69  5612396.02           R-squared =  0.3902

    Adj R-squared =  0.3549

    Total    635065396    73  8699525.97           Root MSE =    2369

    price       Coef.   Std. Err.      t    P>t     [95% Conf. Interval]

    weight    4.915578   1.367776     3.59   0.001      2.18694 7.644216

    length   -103.8873   38.64346    -2.69   0.009    -180.9788 -26.79567

    displacement    9.570863   7.893187     1.21   0.229    -6.175615 25.31734

    gear_ratio    2395.815   1091.898     2.19   0.032      217.537 4574.092

    _cons     1735.29   5817.673     0.30   0.766    -9870.649 13341.23

    . reg  price weight length displacement gear_ratio,beta

    Source        SS       df       MS              Number of obs =      74

    F(  4,    69) =   11.04

    Model    247810070     4  61952517.6           Prob > F =  0.0000

    Residual    387255326    69  5612396.02           R-squared =  0.3902

    Adj R-squared =  0.3549

    Total    635065396    73  8699525.97           Root MSE =    2369

    price       Coef.   Std. Err.      t    P>t Beta

    weight    4.915578   1.367776     3.59   0.001 1.295257

    length   -103.8873   38.64346    -2.69   0.009 -.7842659

    displacement    9.570863   7.893187     1.21   0.229 .2980039

    gear_ratio    2395.815   1091.898     2.19   0.032 .3706326

    _cons     1735.29   5817.673     0.30   0.766 .

    . reg  sprice sw sl sd sg,beta

    Source        SS       df       MS              Number of obs =      74

    F(  4,    69) =   11.04

    Model   28.4854684     4   7.1213671           Prob > F =  0.0000

    Residual    44.514532    69  .645138145           R-squared =  0.3902

    Adj R-squared =  0.3549

    Total   73.0000004    73  1.00000001           Root MSE =   .8032

    sprice       Coef.   Std. Err.      t    P>t Beta

    sw    1.295257   .3604096     3.59   0.001 1.295257

    sl   -.7842659   .2917273    -2.69   0.009 -.7842659

    sd    .2980039   .2457669     1.21   0.229 .2980039

    sg    .3706326   .1689167     2.19   0.032 .3706326

    _cons    3.13e-09   .0933707     0.00   1.000 .

    . ereturn list

    scalars:

    e(N) = 74

    e(df_m) = 4

    e(df_r) = 69

    e(F) = 11.03851501263808

    e(r2) = .3902118936857077

    e(rmse) = .8032049208933202

    e(mss) = 28.48546839290257

    e(rss) = 44.51453200135989

    e(r2_a) = .3548618585370531

    e(ll) = -86.19622382315104

    e(ll_0) = -104.4980425309136

    e(rank) = 5

    macros:

    e(cmdline) : "regress sprice sw sl sd sg,beta"

    e(title) : "Linear regression"

    e(marginsok) : "XB default"

    e(vce) : "ols"

    e(depvar) : "sprice"

    e(cmd) : "regress"

    e(properties) : "b V"

    e(predict) : "regres_p"

    e(model) : "ols"

    e(estat_cmd) : "regress_estat"

    matrices:

    e(b) : 1 x 5

    e(V) : 5 x 5

    functions:

    e(sample)

    . mat a=e(b)

    . matlist a

    sw sl         sd sg _cons

    y1   1.295257 -.7842659   .2980039 .3706326 3.13e-09

    展开全文
  • 回归分析标准系数

    万次阅读 2018-07-30 11:21:41
    假设因变量为y,自变量为x,标准回归系数为a。那么在解释时就要说,当x变化1个标准差是,y变化a个标准差。标准化后的回归系数在不同自变量之间是可比的,没有标准化之前是不可比的。举一个例子:假设因变量是一个人...

    标准化的回归系数是指将数据标准化(减均值除方差)后计算得到的回归系数。因为数据进行了标准化,因此就取消了量纲的影响。

    假设因变量为y,自变量为x,标准回归系数为a。那么在解释时就要说,当x变化1个标准差是,y变化a个标准差。

    标准化后的回归系数在不同自变量之间是可比的,没有标准化之前是不可比的。

    举一个例子:
    假设因变量是一个人的外貌给人的印象(y),自变量有身高(x1)、体重(x2)
    假如未标准化的回归系数分别为a1、a2。在解释时就要说,在体重不变的前提下,当身高增加1厘米时,y增加a1个单位;在身高不变的前提下,体重(x2)增加1千克,y就增加a2个单位。假设a1>a2,那我们能说身高对一个人的外貌比体重更重要吗?这是不能的,因为身高的1厘米和体重的一厘米对于他们自身来说重要的程度是不一样的。

    必须用标准化的回归系数才能比较,因为那时都是身高或体重增加一个标准差,外貌打分增加多少。这时,身高跟体重都增加了一个标准差,这对于他们自身的重要程度是一样的。 

    展开全文
  • 在前期内容中,我们介绍了如何对数据进行标准化处理,将...那么,提到不同变量的效应大小,大家一定会联想到在多因素回归模型中所得到的回归系数。例如,我们假设自变量分别为身高和体重,根据回归系数很容易就知...

    在前期内容中,我们介绍了如何对数据进行标准化处理,将原始的连续型变量转化为一个无量纲的标准化数值,消除不同变量之间因性质、量纲、数量级等属性的差异而带来的影响,从而使不同变量的效应大小具有可比性,因此数据的标准化处理在实际的统计分析中也得到了较为广泛的应用。

    那么,提到不同变量的效应大小,大家一定会联想到在多因素回归模型中所得到的回归系数。例如,我们假设自变量分别为身高和体重,根据回归系数很容易就知道每增加1cm的身高或每增加1kg的体重,引起的对因变量Y的影响大小,但是两者相比之下,到底谁的作用大谁的作用小呢?

    原始的回归系数已经无法回答这样的问题,我们需要借助标准化回归系数来进行判断,今天我们就来向大家介绍一下,在回归模型中这个标准化回归系数到底是个什么鬼?

    标准化回归系数

    VS

    未标准化回归系数

    1、未标准化回归系数

    通常我们在构建多因素回归模型时,方程中呈现的是未标准化回归系数,它是方程中不同自变量对应的原始的回归系数。它反映了在其他因素不变的情况下,该自变量每变化一个单位对因变量的作用大小。通过未标准化回归系数和常数项构建的方程,便可以对因变量进行预测,并得出结论。

    2、标准化回归系数

    而对于标准化回归系数,它是在对自变量和因变量同时进行标准化处理后所得到的回归系数,数据经过标准化处理后消除了量纲、数量级等差异的影响,使得不同变量之间具有可比性,因此可以用标准化回归系数来比较不同自变量对因变量的作用大小。

    通常我们主要关注的是标准化回归系数的绝对值大小,绝对值越大,可认为它对因变量的影响就越大

    3、两者的区别

    未标准化回归系数体现的是自变量变化对因变量的绝对作用大小,而标准化回归系数反映的是不同自变量对因变量的相对作用大小,可以显示出不同自变量对因变量影响的重要性。

    如果用标准化回归系数构建方程,得到的结论是有偏差的,因为此时自变量和因变量的数据都发生了转化,成为了标准化数据,因此标准化回归系数不能用于构建回归方程。

    标准化回归系数

    VS

    每变化1个标准差的回归系数

    我们在前期文章《回归模型中引入连续变量,还有哪些玩法?》中,介绍到对于连续型变量,在纳入多因素回归模型中时,可以将其转变为每变化1个标准差的形式,具体的操作方法是对原始的自变量进行标准化处理,然后再带入到回归模型中,所得到的回归系数即为该自变量每变化1个标准差对应的回归系数。

    那么,我们假设此时有两个自变量,一个自变量的标准差为1,另一个自变量的标准差为100,两者对因变量都具有一定的影响。如果用上述每增加1个标准差对应的回归系数,来判断哪个自变量对因变量的影响更大的话,当同样变化1个标准差时,第一个自变量只需要改变1个单位,而第二个自变量则需要改变100个单位,因此标准差大的自变量改变起来就显得比较困难。此时,我们就需要用标准化回归系数来救场。

    每增加1个标准差对应的回归系数,反映的是自变量每变化1个标准差时对因变量原始值变化产生的影响。而标准化回归系数,它反映的是自变量每变化1个标准差时,对因变量变化1个标准差产生的影响。

    在计算每增加1个标准差对应的回归系数时,我们只需要对原始自变量进行标准化处理;而如果要计算标准化回归系数,则需要对原始的自变量和因变量同时进行标准化处理,标准化为标准正态分布对应的值后再构建回归模型。

    SPSS操作

    一、研究实例

    某研究人员收集了100名研究对象的最大摄氧量(VO2 max),并记录了他们的年龄、体重、心率等信息,拟探讨年龄、体重、心率对VO2 max的作用大小,同时评价上述哪一个因素对VO2 max的影响作用更大。

    e81554fa3fa7a6d58bfac4fde92b73f6.png

    二、操作步骤

    1、多重线性回归

    (操作步骤参考文章《SPSS实例教程:多重线性回归,你用对了么?》)

    4e3261c47bf83d2fd6862c91c4cd6529.png

    根据多重线性回归分析的结果,回归方程可写为:

    VO2 max = 72.581 – 0.188 * age – 0.184 * weight – 0.059 * heart_rate

    其实不难发现,在SPSS的回归结果中,不仅展示了未标准化回归系数(Unstandardized Coefficients),同时也得出了标准化回归系数(Standardized Coefficients)。

    注意,未标准化回归系数更大的自变量,其标准化回归系数不一定更大。例如本例中,age的未标准化回归系数绝对值为0.188,大于weight的绝对值0.184,但是weight的标准化回归系数绝对值为0.325,却大于age的标准化回归系数绝对值0.200,说明weight对于VO2 max的影响较age更大。

    2、数据标准化处理

    (操作步骤参考前期推送文章《你听说过数据标准化处理吗?》)

    虽然SPSS在回归结果中可以直接输出标准化回归系数,但为了加深对它的理解,我们可以亲自对数据进行一遍标准化处理,对上述结果进行一下验证。

    Analyze → Descriptive Statistics → Descriptives → Save standardized values as variables

    通过上述步骤分别生成4个标准化处理后的新变量。

    f0abc1f94b885cb86162bb5a999efc43.png

    3、标准化回归系数

    在进行多重线性回归时,以VO2 max的标准化形式作为因变量,以age、 weight、 heart_rate的标准化形式作为自变量构建模型。结果发现,所得的结果与上述结果一致。

    50ce5eb2c189d25da6cdede590c9a234.png 30fca3bb9acb7c0ab05551cc65d7df93.png

    相互转换关系

    今天我们介绍了未标准化回归系数、每变化1个标准差的回归系数、以及标准化回归系数,最后再跟大家补充一下三者之间的相互转换关系。

    每变化1个标准差的回归系数= 未标准化回归系数 * 该自变量的标准差

    标准化回归系数= 未标准化回归系数 * 该自变量的标准差 / 因变量的标准差

    大家可以根据上述转换关系自行进行验证哈。

    哦,对了,细心的同学会发现,在SPSS中多重线性回归可以直接输出标准化回归系数,但是在logistic回归中,SPSS只能输出原始的未标准化的回归系数,如果我们想要计算logistic回归的标准化回归系数,比较不同自变量对因变量的相对作用大小,应该怎么办呢?

    根据上述标准化回归系数的转换关系,在logistic回归中随机变量分布函数的标准差为π / √3 = 1.8138[1],故标准化回归系数 = 未标准化回归系数 * 该自变量的标准差 / 1.8138,即可计算logistic回归的标准化回归系数。

    参考文献

    [1] 宋娜. 多元Logistic分布及其参数估计[D]. 北京工业大学, 2007.

    医咖会微信:medieco-ykh

    关注医咖会,及时获取最新统计教程

    展开全文
  • 介绍这是一个 R 包,它提供了为不同类型的线性模型计算标准回归系数(称为 beta)的函数。使用包使用很简单betas.lm( fit ) # fit is a linear model 或者betas.lmr( fit.robust ) # fit.robust is a robust ...
  • 对多元线性回归进行因子筛选,最后给出一定显著性水平下各因子均为显著的回归方程中的' 诸回归系数、偏回归平方和、估计的标准偏差、复相关系数、F-检验值、各回归系数标准' 偏差、应变量条件期望值的估计值及残差...
  • 机器学习_线性回归_回归系数

    千次阅读 2019-03-24 19:02:52
    回归系数存放在向量w中: 那么对于给定的数据x1,即矩阵X的第一列数据,预测结果u1将会通过如下公式给出: 现在的问题是,手里有数据矩阵X和对应的标签向量y,怎么才能找到w呢?一个常用的方法就是找出使...
  • 最近蒋老师收到好多小伙伴的提问,为什么在Unscrambler里不能画beta的系数图鸭? 那目前在Unscrambler10.4的Beta Cofficients(raw)中是暂不支持导出数据矩阵的 不过我们有其他的小妙招! 准备好你们的小板凳了吗?...
  • 关于回归分析中的数据标准化以及标准化和非标准回归系数的问题。
  • β:回归系数,即斜率;α:截距回归系数的显著性检验目的是检测自变量对于回归模型是否有必要。假设: H0:β = 0, H1:β≠0 ; 临界值: Tα/2(n-2)判断:若 |t| < tα/2, 接受H0,自变量不显著;...
  • python中的回归系数计算

    千次阅读 2020-12-11 09:54:02
    我想用下面的公式找出每个术语的回归系数Y = C1aX1a C1bX1b ... C2aX2a C2bX2b .... C0,其中Y是活动Cna,残差选择a在位置n的回归系数,X虚拟变量编码(xna = 1或0)对应于位置n处残差选择a的存在与否,以及C0的平均...
  • 线性回归计算回归系数

    千次阅读 2019-07-04 09:38:38
    线性回归: 优点:结果易于理解,计算上不复杂 缺点:对非线性的数据拟合不好 适用数据类型:数值型和标称型数据 标称型数据:一般在有限的数据中取,而且只存在“是”和“否”两种不同的结果(一般用于分类) ...
  • 如何检验两组回归系数之间的差别

    千次阅读 2021-01-17 19:33:50
    比较两个回归系数之间差别的公式为:(b1-b2)/se12,其中b1和b2是被比较的回归系,se12是两者的JoinStandardError(联合标准误差),其结果是一个以自由度为n-k-2的t分布(其中n是样本量、k是原来的自变量数,本案中为x...
  • 机器学习——回归系数的计算(2)

    千次阅读 2020-01-12 12:09:05
    1、最小二乘法(min square)求解回归系数 将训练特征表示为 X 矩阵,结果表示成 y 向量,仍然是线性回归模型,误差函数不变。那么 θ 可以直接由下面公式得出 用矩阵可表示为 因为要求函数的极小值,对θ求导...
  • getwd()———–逐步回归——————read.table("demo.csv",header=TRUE,sep=",")->demo demo scale.demo(demo[,c("a1","a2","a3","a4","a5","a6","y")],center = T,scale = T)#标准化数据 scale.demo cb
  • Logistic回归结果的回归系数和OR值解读。Logistic回归虽然名字叫”回归”,但却是一种分类学习方法。使用场景大概有两个:第一用来预测,第二寻找因变量的影响因素。一 从线性回归到Logistic回归线性回归和Logistic...
  • 【统计】回归系数与相关系数的联系与区别

    万次阅读 多人点赞 2020-03-29 16:27:15
    目录一、基础知识二、回归系数与相关系数1.定义2.二者的联系3.二者的区别 假设有两个随机变量(x,y)(x,y)(x,y),其NNN个样本组合为(x1,x2,…,xN)(x_1,x_2,\dots,x_N)(x1​,x2​,…,xN​)和(y1,y2,…,yN)(y_1,y_...
  • 对于一般增长曲线模型,在损失函数(d(y)-KBL)’(d(y)-KBL)下得出了回归系数的线性可估函数KBL的齐次线性估计DYF在齐次线性估计类中是可容许估计的充分必要条件。同时,对于不同的矩阵大小比较标准分别讨论了...
  • [回归分析][9.5]--标准系数

    千次阅读 2016-11-22 21:56:50
     作用:当拟合时数据单位不一样时,得到的回归系数大小没有可比性(不能比较谁比较重要),这时就要计算标准话系数。  这里就讲一下标准化系数的求法。   lm = LinearModelFit[data[[All, {2, 3, 1}]], {x1, x2},...
  • matlab回归分析

    万次阅读 多人点赞 2018-10-14 15:53:29
    R称为复相关系数,R越大,y与x1,x2,x3.....的关系越密切,通常R大于0.8(或0.9)才认为相关关系成立 一个例子 matlab代码为 clc,clear x1=[0.1:0.01:0.18]'; y=[42 41.5 45 45.5 45 47.5 49 55 50]'; x=[ones(9...
  • 深入解读Logistic回归结果(一):回归系数,OR关键词:Logistic回归分析、lasso回归系数解读、回归系数解读Logistic回归虽然名字叫”回归”,但却是一种分类学习方法。使用场景大概有两个:第一用来预测,第二寻找因...
  • 登录后查看更多精彩内容~您需要 登录 才可以下载或查看,没有帐号?...在论坛查看了前辈的一些帖子,将SFW系数用dim_standardize做了标准化,可以得到一个看起来还比较合适的图,并出现回归系数绝对值...
  • 1. 比较两个回归系数之间差别的公式为:(b1-b2)/se12,其中b1和b2是被比较的回归系,se12是两者的Join Standard Error(联合标准误差),其结果是一个以自由度为n-k-2的t分布(其中n是样本量、k是原来的自变量数,本案...
  • 在这里,我尝试生成一个不平衡的分类集,运行logistic回归,绘制数据点并绘制决策边界线。在为了绘制决策边界线,我首先得到系数:coef = clf.best_estimator_.coef_intercept = clf.best_estimator_.intercept_然后...
  • stata实证分析专题【计量经济系列(三)】reg有常数项的回归 绘制回归图像 无常数项的回归 多元回归 vce回归系数协方差矩阵 对部分满足条件数据做回归 predict 添加拟合值变量 添加残差变量系数的检验 test
  • 本文详细的讲解了最小二乘估计回归系数的数学步骤,对于理解最小二乘回归的原理有很大帮助。
  • 一、内在关系 直线回归与相关的性质或方向(正或负)相同,显著性测验等价,说明两者之间... 回归系数b是有单位的,但若对b作消去单位的标准化处理,即对b中x,y的离均差以各自的标准差 和 为单位:      ...
  • 提到不同变量的效应大小,大家一定会联想到在多因素...原始的回归系数已经无法回答这样的问题,我们需要借助标准回归系数来进行判断,今天我们就来向大家介绍一下,在回归模型中这个标准回归系数到底是个什么鬼...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 36,369
精华内容 14,547
关键字:

标准回归系数

友情链接: main.rar