精华内容
下载资源
问答
  • 标准化回归系数
    万次阅读
    2018-07-30 11:21:41

    标准化的回归系数是指将数据标准化(减均值除方差)后计算得到的回归系数。因为数据进行了标准化,因此就取消了量纲的影响。

    假设因变量为y,自变量为x,标准回归系数为a。那么在解释时就要说,当x变化1个标准差是,y变化a个标准差。

    标准化后的回归系数在不同自变量之间是可比的,没有标准化之前是不可比的。

    举一个例子:
    假设因变量是一个人的外貌给人的印象(y),自变量有身高(x1)、体重(x2)
    假如未标准化的回归系数分别为a1、a2。在解释时就要说,在体重不变的前提下,当身高增加1厘米时,y增加a1个单位;在身高不变的前提下,体重(x2)增加1千克,y就增加a2个单位。假设a1>a2,那我们能说身高对一个人的外貌比体重更重要吗?这是不能的,因为身高的1厘米和体重的一厘米对于他们自身来说重要的程度是不一样的。

    必须用标准化的回归系数才能比较,因为那时都是身高或体重增加一个标准差,外貌打分增加多少。这时,身高跟体重都增加了一个标准差,这对于他们自身的重要程度是一样的。 

    更多相关内容
  • 在前期内容中,我们介绍了如何对数据进行标准化处理,将原始的连续型变量转化为一个无量纲的标准化数值,消除不同变量之间因性质、量纲、数量级等属性的差异而带来的影响,从而使不同变量的效应大小具有可比性,因此...

    在前期内容中,我们介绍了如何对数据进行标准化处理,将原始的连续型变量转化为一个无量纲的标准化数值,消除不同变量之间因性质、量纲、数量级等属性的差异而带来的影响,从而使不同变量的效应大小具有可比性,因此数据的标准化处理在实际的统计分析中也得到了较为广泛的应用。

    那么,提到不同变量的效应大小,大家一定会联想到在多因素回归模型中所得到的回归系数。例如,我们假设自变量分别为身高和体重,根据回归系数很容易就知道每增加1cm的身高或每增加1kg的体重,引起的对因变量Y的影响大小,但是两者相比之下,到底谁的作用大谁的作用小呢?

    原始的回归系数已经无法回答这样的问题,我们需要借助标准化回归系数来进行判断,今天我们就来向大家介绍一下,在回归模型中这个标准化回归系数到底是个什么鬼?

    标准化回归系数

    VS

    未标准化回归系数

    1、未标准化回归系数

    通常我们在构建多因素回归模型时,方程中呈现的是未标准化回归系数,它是方程中不同自变量对应的原始的回归系数。它反映了在其他因素不变的情况下,该自变量每变化一个单位对因变量的作用大小。通过未标准化回归系数和常数项构建的方程,便可以对因变量进行预测,并得出结论。

    2、标准化回归系数

    而对于标准化回归系数,它是在对自变量和因变量同时进行标准化处理后所得到的回归系数,数据经过标准化处理后消除了量纲、数量级等差异的影响,使得不同变量之间具有可比性,因此可以用标准化回归系数来比较不同自变量对因变量的作用大小。

    通常我们主要关注的是标准化回归系数的绝对值大小,绝对值越大,可认为它对因变量的影响就越大

    3、两者的区别

    未标准化回归系数体现的是自变量变化对因变量的绝对作用大小,而标准化回归系数反映的是不同自变量对因变量的相对作用大小,可以显示出不同自变量对因变量影响的重要性。

    如果用标准化回归系数构建方程,得到的结论是有偏差的,因为此时自变量和因变量的数据都发生了转化,成为了标准化数据,因此标准化回归系数不能用于构建回归方程。

    标准化回归系数

    VS

    每变化1个标准差的回归系数

    我们在前期文章《回归模型中引入连续变量,还有哪些玩法?》中,介绍到对于连续型变量,在纳入多因素回归模型中时,可以将其转变为每变化1个标准差的形式,具体的操作方法是对原始的自变量进行标准化处理,然后再带入到回归模型中,所得到的回归系数即为该自变量每变化1个标准差对应的回归系数。

    那么,我们假设此时有两个自变量,一个自变量的标准差为1,另一个自变量的标准差为100,两者对因变量都具有一定的影响。如果用上述每增加1个标准差对应的回归系数,来判断哪个自变量对因变量的影响更大的话,当同样变化1个标准差时,第一个自变量只需要改变1个单位,而第二个自变量则需要改变100个单位,因此标准差大的自变量改变起来就显得比较困难。此时,我们就需要用标准化回归系数来救场。

    每增加1个标准差对应的回归系数,反映的是自变量每变化1个标准差时对因变量原始值变化产生的影响。而标准化回归系数,它反映的是自变量每变化1个标准差时,对因变量变化1个标准差产生的影响。

    在计算每增加1个标准差对应的回归系数时,我们只需要对原始自变量进行标准化处理;而如果要计算标准化回归系数,则需要对原始的自变量和因变量同时进行标准化处理,标准化为标准正态分布对应的值后再构建回归模型。

    SPSS操作

    一、研究实例

    某研究人员收集了100名研究对象的最大摄氧量(VO2 max),并记录了他们的年龄、体重、心率等信息,拟探讨年龄、体重、心率对VO2 max的作用大小,同时评价上述哪一个因素对VO2 max的影响作用更大。

    e81554fa3fa7a6d58bfac4fde92b73f6.png

    二、操作步骤

    1、多重线性回归

    (操作步骤参考文章《SPSS实例教程:多重线性回归,你用对了么?》)

    4e3261c47bf83d2fd6862c91c4cd6529.png

    根据多重线性回归分析的结果,回归方程可写为:

    VO2 max = 72.581 – 0.188 * age – 0.184 * weight – 0.059 * heart_rate

    其实不难发现,在SPSS的回归结果中,不仅展示了未标准化回归系数(Unstandardized Coefficients),同时也得出了标准化回归系数(Standardized Coefficients)。

    注意,未标准化回归系数更大的自变量,其标准化回归系数不一定更大。例如本例中,age的未标准化回归系数绝对值为0.188,大于weight的绝对值0.184,但是weight的标准化回归系数绝对值为0.325,却大于age的标准化回归系数绝对值0.200,说明weight对于VO2 max的影响较age更大。

    2、数据标准化处理

    (操作步骤参考前期推送文章《你听说过数据标准化处理吗?》)

    虽然SPSS在回归结果中可以直接输出标准化回归系数,但为了加深对它的理解,我们可以亲自对数据进行一遍标准化处理,对上述结果进行一下验证。

    Analyze → Descriptive Statistics → Descriptives → Save standardized values as variables

    通过上述步骤分别生成4个标准化处理后的新变量。

    f0abc1f94b885cb86162bb5a999efc43.png

    3、标准化回归系数

    在进行多重线性回归时,以VO2 max的标准化形式作为因变量,以age、 weight、 heart_rate的标准化形式作为自变量构建模型。结果发现,所得的结果与上述结果一致。

    50ce5eb2c189d25da6cdede590c9a234.png 30fca3bb9acb7c0ab05551cc65d7df93.png

    相互转换关系

    今天我们介绍了未标准化回归系数、每变化1个标准差的回归系数、以及标准化回归系数,最后再跟大家补充一下三者之间的相互转换关系。

    每变化1个标准差的回归系数= 未标准化回归系数 * 该自变量的标准差

    标准化回归系数= 未标准化回归系数 * 该自变量的标准差 / 因变量的标准差

    大家可以根据上述转换关系自行进行验证哈。

    哦,对了,细心的同学会发现,在SPSS中多重线性回归可以直接输出标准化回归系数,但是在logistic回归中,SPSS只能输出原始的未标准化的回归系数,如果我们想要计算logistic回归的标准化回归系数,比较不同自变量对因变量的相对作用大小,应该怎么办呢?

    根据上述标准化回归系数的转换关系,在logistic回归中随机变量分布函数的标准差为π / √3 = 1.8138[1],故标准化回归系数 = 未标准化回归系数 * 该自变量的标准差 / 1.8138,即可计算logistic回归的标准化回归系数。

    参考文献

    [1] 宋娜. 多元Logistic分布及其参数估计[D]. 北京工业大学, 2007.

    医咖会微信:medieco-ykh

    关注医咖会,及时获取最新统计教程

    展开全文
  • 介绍这是一个 R 包,它提供了为不同类型的线性模型计算标准化回归系数(称为 beta)的函数。使用包使用很简单betas.lm( fit ) # fit is a linear model 或者betas.lmr( fit.robust ) # fit.robust is a robust ...
  • setwd(“D:\R\myrfile”) getwd()———–逐步回归——————read.table("demo.csv",header=TRUE,sep=...scale.demo(demo[,c("a1","a2","a3","a4","a5","a6","y")],center = T,scale = T)#标准化数据 scale.demo cb

    setwd(“D:\R\myrfile”)
    getwd()

    –逐步回归提取回归结果参数-调整R方,标准化回归系数—-

    read.table("demo.csv",header=TRUE,sep=",")->demo
    demo
    scale.demo<-scale(demo[,c("a1","a2","a3","a4","a5","a6","y")],center = T,scale = T)#标准化数据
    scale.demo
    cbind.scale.demo<-cbind.data.frame(demo[1:6],scale.demo,deparse.level = 1)#合并基本信息和标准化数据
    cbind.scale.demo
    lm.demo<-lm(y~a1+a2+a3+a4+a5+a6,data=cbind.scale.demo)#多元回归
    summary(lm.demo)
    lm.step<-step(lm.demo)#逐步回归
    summary(lm.step)

    提取回归R方

    summary(lm.step)$r.square #提取R方
    
    lm.step$coeff #提取首列-回归系数
    lm.step$coefficients#默认提取首列回归系数
    lmResults<-summary(lm.step)#将逐步回归结果赋值给a
    lmResults
    lmResults$r.squared#提取R方
    lmResults$adj.r.squared#提取调整R方Adjusted R-squared
    lmResults$fstatistic#F统计量
    lmResults$
    a<-summary(lm.step)$coefficients#将逐步回归结果赋值给矩阵
    a
    
    a$coeff[,1]#提取首列-回归系数
    a$coefficients[,2]#提取标准误
    a$coefficients[,3]#提取t值 t value
    a$coefficients[,4]#提取取Pr
    b<-a$coefficients
    b
    mode(b)#numeric
    class(b)#matrix
    b[,1]#提取首列-回归系数
    b[,2]#提取标准误
    b[,3]#提取t值 t value
    b[,4]#提取Pr
    展开全文
  • 关于回归分析中的数据标准化以及标准化和非标准化回归系数的问题。

         我们在用SPSS做多元线性回归分析时,其结果是看标准化系数还是非标准化系数呢?分析之前要不要对数据标准化?不同影响因素的单位不同,要不要统一单位或对数据标准化呢?

        第一,回归分析反映的是变量之间的关系,即X变化一个单位而Y变化几个单位,因此,如无特别需要,可以直接用各变量的原始数据进行分析,而无需对数据统一单位或数据标准化。

        第二,SPSS等软件的回归分析自动输出标准化和非标准化的系数,因此可以直接获得标准化和非标准化的系数,而无需事先对数据标准化之后再进行回归分析。

        第三,如果想知道解释变量之间谁对因变量影响更大,那么一个简单的做法是比较标准化系数,但这种方法也只是基于简单的观察和比较而不是统计检验,例如标准化回归系数0.35与0.33之间的差异并不一定具有统计学意义。

         第四,当解释变量是分类变量时,标准化回归系数难以做出有意义的解释,此时用非标准化系数更好解释。

          第五,在做实际预测时,要使用非标准化系数和截距,也就是建立非标准化回归方程,而不是标准化回归方程。

    展开全文
  • 提到不同变量的效应大小,大家一定会联想到在多因素...原始的回归系数已经无法回答这样的问题,我们需要借助标准化回归系数来进行判断,今天我们就来向大家介绍一下,在回归模型中这个标准化回归系数到底是个什么鬼...
  • 回归标准系数

    千次阅读 2018-05-15 10:15:07
    标准化回归系数是指将数据标准化(减均值除方差)后计算得到的回归系数。因为数据进行了标准化,因此就取消了量纲的影响。 假设因变量为y,自变量为x,标准回归系数为a。那么在解释时就要说,当x变化1个标准差是...
  • [回归分析][9.5]--标准化系数

    千次阅读 2016-11-22 21:56:50
     作用:当拟合时数据单位不一样时,得到的回归系数大小没有可比性(不能比较谁比较重要),这时就要计算标准话系数。  这里就讲一下标准化系数的求法。   lm = LinearModelFit[data[[All, {2, 3, 1}]], {x1, x2},...
  • 使用spss求标准化的线性回归方程

    千次阅读 2021-11-05 09:48:13
    1 要求标准化的线性回归方程先要有标准化的数据 2 点击 分析–>描述统计–>描述 3勾选如图 4 选择欲标准化的数据 5 确定,得到标准化的数据 6 按照求普通线性回归方程的步骤对标准化的数据求回归方程 7 得到...
  • 标准回归系数引用

    千次阅读 2020-12-20 01:53:15
    举例如下(附do文件及结果):reg y x1-x6 与 reg y x1-x6,beta结果回归系数一样,但前者没有显示标准回归系数,并且后者的标准系数也没有办法贮存在变量或matrix中,这是我比较关心的但通过将数据标准化后,...
  • 深入解读Logistic回归结果(一):回归系数,OR

    万次阅读 多人点赞 2020-11-20 17:29:11
    Logistic回归虽然名字叫”回归” ,但却是一种分类学习方法。使用场景大概有两个:第一用来预测,第二寻找因变量的影响因素。  一 从线性回归到Logistic回归 线性回归和Logistic回归都是广义线性模型的...
  • 一、内在关系 直线回归与相关的性质或方向(正或负)...(1)相关系数是标准化回归系数  回归系数b是有单位的,但若对b作消去单位的标准化处理,即对b中x,y的离均差以各自的标准差 和 为单位:      ...
  • 清风数模课---多元回归分析笔记
  • 本文详细的讲解了最小二乘估计回归系数的数学步骤,对于理解最小二乘回归的原理有很大帮助。
  • 原文地址:深入解读Logistic回归结果(一):回归系数,OR作者:王江源转文地址https://blog.csdn.net/sjpljr/article/details/70169046  作者:sjpljr我想说,你们真是太厉害了!Logistic回归虽然名字叫”回归” ...
  • 数据分析时经常需要数据标准化处理,常见的比如:回归、主成分、因子分析等,在神经网络、聚类分析中也会经常用到数据标准化预处理,甚至感觉一切的数据分析好像都需要标准化预处理。 数据标准化的作用主要时消除...
  • (1)标准化回归系数计算(公式): (2)t=回归系数/回归系数的标准误;t=常数项/常数项的标准误;例:-3.239=-12189.036/3762.784; (3)VIF(方差膨胀因子): ;对于VIF说明:其值介于
  • 回归分析(stata实例详细解答过程)

    万次阅读 多人点赞 2021-09-02 11:33:47
    现有某电商平台846条关于婴幼儿奶粉的销售信息,每条信息由11个指 标组成。其中,评价量可以从一个侧面反映顾客对产品的关注度。 请对所给数据进行以下方面的分析,要求最终的分析将不仅仅...我们在这里用回归分析,...
  •  t检验和回归系数的置信区间  当上述F检验结论是推翻H0时,并不见得每个解释变量都对yt有显著的解释作用(即不见得每一个都是重要解释变量),所以还应对每个解释变量的系数进行显著性检验。零假设
  • 做线性回归的时候,检验回归方程和各变量对因变量的解释参数很容易搞混乱,下面对这些参数进行一下说明:1.t检验:t检验是对单个变量系数的显著性检验 一般看p值; 如果p值小于0.05表示该自变量对因变量解释性很强。...
  • Matlab数据标准化

    千次阅读 2014-11-29 21:45:57
    zscore %据说就是原数据减去均值再除以标准差 标准回归系数:  1、标准化回归系数测度的是对被解释变量的重要性,只有标准化了,才能进行重要性对比。
  • 线性回归计算回归系数

    千次阅读 2019-07-04 09:38:38
    """ 线性回归: 优点:结果易于理解,计算上不复杂 ... 数值型数据:可以在无线的数据中取,而且数值比较具体,例如4.02, 6.23这种值(一般用于回归分析) 回归的一般方法: 1收集数据:采用任...
  • 线性回归是一种简单又强大的统计模型,可用于检测两个或者多个变量之间的线性关系。常用统计软件包括R,Python,SPSS等都有相应模块帮助我们轻松建立线性回归模型。但面对软件给出的一长串统计结果时,很多朋友不...
  • 【统计】回归系数与相关系数的联系与区别

    万次阅读 多人点赞 2020-03-29 16:27:15
    目录一、基础知识二、回归系数与相关系数1.定义2.二者的联系3.二者的区别 假设有两个随机变量(x,y)(x,y)(x,y),其NNN个样本组合为(x1,x2,…,xN)(x_1,x_2,\dots,x_N)(x1​,x2​,…,xN​)和(y1,y2,…,yN)(y_1,y_...
  • 基于Amos路径分析的输出结果参数详解

    万次阅读 多人点赞 2021-03-04 12:39:45
    即使没有分布假设,临界比率也具有以下解释:对于任何不受约束的参数,其临界比率的平方大约是在固定该参数固定为零的情况下重复进行分析,卡方统计量将增加的量(其不适用于相关性和标准化回归系数,也不适用于ULS...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 31,530
精华内容 12,612
关键字:

标准化回归系数

友情链接: layui-v2.3.0.zip