精华内容
下载资源
问答
  • 标准化回归
    千次阅读
    2022-07-12 02:48:11

         我们在用SPSS做多元线性回归分析时,其结果是看标准化系数还是非标准化系数呢?分析之前要不要对数据标准化?不同影响因素的单位不同,要不要统一单位或对数据标准化呢?

        第一,回归分析反映的是变量之间的关系,即X变化一个单位而Y变化几个单位,因此,如无特别需要,可以直接用各变量的原始数据进行分析,而无需对数据统一单位或数据标准化。

        第二,SPSS等软件的回归分析自动输出标准化和非标准化的系数,因此可以直接获得标准化和非标准化的系数,而无需事先对数据标准化之后再进行回归分析。

        第三,如果想知道解释变量之间谁对因变量影响更大,那么一个简单的做法是比较标准化系数,但这种方法也只是基于简单的观察和比较而不是统计检验,例如标准化回归系数0.35与0.33之间的差异并不一定具有统计学意义。

         第四,当解释变量是分类变量时,标准化回归系数难以做出有意义的解释,此时用非标准化系数更好解释。

          第五,在做实际预测时,要使用非标准化系数和截距,也就是建立非标准化回归方程,而不是标准化回归方程。

    更多相关内容
  • 在前期内容中,我们介绍了如何对数据进行标准化处理,将原始的连续型变量转化为一个无量纲的标准化数值,消除不同变量之间因性质、量纲、数量级等属性的差异而带来的影响,从而使不同变量的效应大小具有可比性,因此...

    在前期内容中,我们介绍了如何对数据进行标准化处理,将原始的连续型变量转化为一个无量纲的标准化数值,消除不同变量之间因性质、量纲、数量级等属性的差异而带来的影响,从而使不同变量的效应大小具有可比性,因此数据的标准化处理在实际的统计分析中也得到了较为广泛的应用。

    那么,提到不同变量的效应大小,大家一定会联想到在多因素回归模型中所得到的回归系数。例如,我们假设自变量分别为身高和体重,根据回归系数很容易就知道每增加1cm的身高或每增加1kg的体重,引起的对因变量Y的影响大小,但是两者相比之下,到底谁的作用大谁的作用小呢?

    原始的回归系数已经无法回答这样的问题,我们需要借助标准化回归系数来进行判断,今天我们就来向大家介绍一下,在回归模型中这个标准化回归系数到底是个什么鬼?

    标准化回归系数

    VS

    未标准化回归系数

    1、未标准化回归系数

    通常我们在构建多因素回归模型时,方程中呈现的是未标准化回归系数,它是方程中不同自变量对应的原始的回归系数。它反映了在其他因素不变的情况下,该自变量每变化一个单位对因变量的作用大小。通过未标准化回归系数和常数项构建的方程,便可以对因变量进行预测,并得出结论。

    2、标准化回归系数

    而对于标准化回归系数,它是在对自变量和因变量同时进行标准化处理后所得到的回归系数,数据经过标准化处理后消除了量纲、数量级等差异的影响,使得不同变量之间具有可比性,因此可以用标准化回归系数来比较不同自变量对因变量的作用大小。

    通常我们主要关注的是标准化回归系数的绝对值大小,绝对值越大,可认为它对因变量的影响就越大

    3、两者的区别

    未标准化回归系数体现的是自变量变化对因变量的绝对作用大小,而标准化回归系数反映的是不同自变量对因变量的相对作用大小,可以显示出不同自变量对因变量影响的重要性。

    如果用标准化回归系数构建方程,得到的结论是有偏差的,因为此时自变量和因变量的数据都发生了转化,成为了标准化数据,因此标准化回归系数不能用于构建回归方程。

    标准化回归系数

    VS

    每变化1个标准差的回归系数

    我们在前期文章《回归模型中引入连续变量,还有哪些玩法?》中,介绍到对于连续型变量,在纳入多因素回归模型中时,可以将其转变为每变化1个标准差的形式,具体的操作方法是对原始的自变量进行标准化处理,然后再带入到回归模型中,所得到的回归系数即为该自变量每变化1个标准差对应的回归系数。

    那么,我们假设此时有两个自变量,一个自变量的标准差为1,另一个自变量的标准差为100,两者对因变量都具有一定的影响。如果用上述每增加1个标准差对应的回归系数,来判断哪个自变量对因变量的影响更大的话,当同样变化1个标准差时,第一个自变量只需要改变1个单位,而第二个自变量则需要改变100个单位,因此标准差大的自变量改变起来就显得比较困难。此时,我们就需要用标准化回归系数来救场。

    每增加1个标准差对应的回归系数,反映的是自变量每变化1个标准差时对因变量原始值变化产生的影响。而标准化回归系数,它反映的是自变量每变化1个标准差时,对因变量变化1个标准差产生的影响。

    在计算每增加1个标准差对应的回归系数时,我们只需要对原始自变量进行标准化处理;而如果要计算标准化回归系数,则需要对原始的自变量和因变量同时进行标准化处理,标准化为标准正态分布对应的值后再构建回归模型。

    SPSS操作

    一、研究实例

    某研究人员收集了100名研究对象的最大摄氧量(VO2 max),并记录了他们的年龄、体重、心率等信息,拟探讨年龄、体重、心率对VO2 max的作用大小,同时评价上述哪一个因素对VO2 max的影响作用更大。

    e81554fa3fa7a6d58bfac4fde92b73f6.png

    二、操作步骤

    1、多重线性回归

    (操作步骤参考文章《SPSS实例教程:多重线性回归,你用对了么?》)

    4e3261c47bf83d2fd6862c91c4cd6529.png

    根据多重线性回归分析的结果,回归方程可写为:

    VO2 max = 72.581 – 0.188 * age – 0.184 * weight – 0.059 * heart_rate

    其实不难发现,在SPSS的回归结果中,不仅展示了未标准化回归系数(Unstandardized Coefficients),同时也得出了标准化回归系数(Standardized Coefficients)。

    注意,未标准化回归系数更大的自变量,其标准化回归系数不一定更大。例如本例中,age的未标准化回归系数绝对值为0.188,大于weight的绝对值0.184,但是weight的标准化回归系数绝对值为0.325,却大于age的标准化回归系数绝对值0.200,说明weight对于VO2 max的影响较age更大。

    2、数据标准化处理

    (操作步骤参考前期推送文章《你听说过数据标准化处理吗?》)

    虽然SPSS在回归结果中可以直接输出标准化回归系数,但为了加深对它的理解,我们可以亲自对数据进行一遍标准化处理,对上述结果进行一下验证。

    Analyze → Descriptive Statistics → Descriptives → Save standardized values as variables

    通过上述步骤分别生成4个标准化处理后的新变量。

    f0abc1f94b885cb86162bb5a999efc43.png

    3、标准化回归系数

    在进行多重线性回归时,以VO2 max的标准化形式作为因变量,以age、 weight、 heart_rate的标准化形式作为自变量构建模型。结果发现,所得的结果与上述结果一致。

    50ce5eb2c189d25da6cdede590c9a234.png 30fca3bb9acb7c0ab05551cc65d7df93.png

    相互转换关系

    今天我们介绍了未标准化回归系数、每变化1个标准差的回归系数、以及标准化回归系数,最后再跟大家补充一下三者之间的相互转换关系。

    每变化1个标准差的回归系数= 未标准化回归系数 * 该自变量的标准差

    标准化回归系数= 未标准化回归系数 * 该自变量的标准差 / 因变量的标准差

    大家可以根据上述转换关系自行进行验证哈。

    哦,对了,细心的同学会发现,在SPSS中多重线性回归可以直接输出标准化回归系数,但是在logistic回归中,SPSS只能输出原始的未标准化的回归系数,如果我们想要计算logistic回归的标准化回归系数,比较不同自变量对因变量的相对作用大小,应该怎么办呢?

    根据上述标准化回归系数的转换关系,在logistic回归中随机变量分布函数的标准差为π / √3 = 1.8138[1],故标准化回归系数 = 未标准化回归系数 * 该自变量的标准差 / 1.8138,即可计算logistic回归的标准化回归系数。

    参考文献

    [1] 宋娜. 多元Logistic分布及其参数估计[D]. 北京工业大学, 2007.

    医咖会微信:medieco-ykh

    关注医咖会,及时获取最新统计教程

    展开全文
  • setwd(“D:\R\myrfile”) getwd()———–逐步回归——————read.table("demo.csv",header=TRUE,sep=...scale.demo(demo[,c("a1","a2","a3","a4","a5","a6","y")],center = T,scale = T)#标准化数据 scale.demo cb

    setwd(“D:\R\myrfile”)
    getwd()

    –逐步回归提取回归结果参数-调整R方,标准化回归系数—-

    read.table("demo.csv",header=TRUE,sep=",")->demo
    demo
    scale.demo<-scale(demo[,c("a1","a2","a3","a4","a5","a6","y")],center = T,scale = T)#标准化数据
    scale.demo
    cbind.scale.demo<-cbind.data.frame(demo[1:6],scale.demo,deparse.level = 1)#合并基本信息和标准化数据
    cbind.scale.demo
    lm.demo<-lm(y~a1+a2+a3+a4+a5+a6,data=cbind.scale.demo)#多元回归
    summary(lm.demo)
    lm.step<-step(lm.demo)#逐步回归
    summary(lm.step)

    提取回归R方

    summary(lm.step)$r.square #提取R方
    
    lm.step$coeff #提取首列-回归系数
    lm.step$coefficients#默认提取首列回归系数
    lmResults<-summary(lm.step)#将逐步回归结果赋值给a
    lmResults
    lmResults$r.squared#提取R方
    lmResults$adj.r.squared#提取调整R方Adjusted R-squared
    lmResults$fstatistic#F统计量
    lmResults$
    a<-summary(lm.step)$coefficients#将逐步回归结果赋值给矩阵
    a
    
    a$coeff[,1]#提取首列-回归系数
    a$coefficients[,2]#提取标准误
    a$coefficients[,3]#提取t值 t value
    a$coefficients[,4]#提取取Pr
    b<-a$coefficients
    b
    mode(b)#numeric
    class(b)#matrix
    b[,1]#提取首列-回归系数
    b[,2]#提取标准误
    b[,3]#提取t值 t value
    b[,4]#提取Pr
    展开全文
  • 使用spss求标准化的线性回归方程

    千次阅读 2021-11-05 09:48:13
    1 要求标准化的线性回归方程先要有标准化的数据 2 点击 分析–>描述统计–>描述 3勾选如图 4 选择欲标准化的数据 5 确定,得到标准化的数据 6 按照求普通线性回归方程的步骤对标准化的数据求回归方程 7 得到...

    1 要求标准化的线性回归方程先要有标准化的数据
    2 点击 分析–>描述统计–>描述
    3勾选如图
    在这里插入图片描述
    4 选择欲标准化的数据
    5 确定,得到标准化的数据
    6 按照求普通线性回归方程的步骤对标准化的数据求回归方程
    7 得到标准化的线性回归方程

    展开全文
  • 回归分析标准化系数

    万次阅读 2018-07-30 11:21:41
    标准化回归系数是指将数据标准化(减均值除方差)后计算得到的回归系数。因为数据进行了标准化,因此就取消了量纲的影响。假设因变量为y,自变量为x,标准回归系数为a。那么在解释时就要说,当x变化1个标准差是,y...
  • 提到不同变量的效应大小,大家一定会联想到在多因素...原始的回归系数已经无法回答这样的问题,我们需要借助标准化回归系数来进行判断,今天我们就来向大家介绍一下,在回归模型中这个标准化回归系数到底是个什么鬼...
  • 转:线性回归标准化与R、T、F

    千次阅读 2020-12-17 09:54:34
    转自:https://blog.csdn.net/jinruoyanxu/article/details/51628441?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-1.control&...1、标准化 对于多元线性回归需要对各个自
  • 回归和拟合: 一、回归: 研究一个随机变量Y对另一个(X)或一组(X1,X2,…,Xk)变量的相依关系的统计分析方法。 应用回归预测法时应首先确定变量之间是否存在相关关系。如果变量之间不存在相关关系,对这些变量应用回归...
  • 【机器学习】回归过程中的数据标准化

    万次阅读 多人点赞 2018-05-01 14:12:13
    最近一直很困惑,因为有些资料在进行回归的时候,往往需要数据标准化。然而也有些资料说对于线性回归是不需要标准化。在查询了大量的资料后,准备在这篇博客上做一个总结。 为什么要数据标准化 数据标准化的原理...
  • [回归分析][9.5]--标准化系数

    千次阅读 2016-11-22 21:56:50
    [线性回归][9.5]--标准化系数  作用:当拟合时数据单位不一样时,得到的回归系数大小没有可比性(不能比较谁比较重要),这时就要计算标准话系数。  这里就讲一下标准化系数的求法。   lm = LinearModelFit[data...
  • 回归方程中的两个变量是随机的并且存在误差,即不受研究者控制时,应使用模型II 回归。 当变量都包含误差时,使用普通最小二乘法的模型 I 回归低估了变量之间线性关系的斜率。 根据 Sokal 和 Rohlf (1995) 的说法...
  • 回归标准系数

    千次阅读 2018-05-15 10:15:07
    标准化回归系数是指将数据标准化(减均值除方差)后计算得到的回归系数。因为数据进行了标准化,因此就取消了量纲的影响。 假设因变量为y,自变量为x,标准回归系数为a。那么在解释时就要说,当x变化1个标准差是...
  • 数据分析时经常需要数据标准化处理,常见的比如:回归、主成分、因子分析等,在神经网络、聚类分析中也会经常用到数据标准化预处理,甚至感觉一切的数据分析好像都需要标准化预处理。 数据标准化的作用主要时消除...
  • //进行count_visit字段的数据进行 标准化处理 val countVisitRDD: RDD[Vector] = userVisitPayRDD .map(row =>Vectors.dense(row.getString(2).toDouble)) //标准化,此列均值和标准差 val standardMode: ...
  • 线性回归标准化 R^2, T检验, F检验

    万次阅读 多人点赞 2018-05-13 16:29:46
    标准化方法:即将原始数据减去相应变量的均数后再除以该变量的标准差,而标准化得到的回归方程称为标准化回归方程,相应得回归系数为标准化回归系数。2、T检验T检验是对各个回归系数的检验,绝对值越大,sig就越小,...
  • 数据中心化和标准化

    千次阅读 2019-01-24 20:19:55
    意义:数据中心化和标准化回归分析中是取消由于量纲不同、自身变异或者数值相差较大所引起的误差。&amp;nbsp;原理:数据标准化:是指数值减去均值,再除以标准差;&amp;nbsp;数据中心化:是指变量减去它的...
  • 多元线性回归的中心化和标准化实验结果比较.pdf
  • 标准化发病率(SIR)或死亡率(SMR)是观察病例和期望病例的比率。观察到的病例是队列中病例的绝对数量。期望病例是通过将队列中的人-年数与参考人口比率相乘得出的。该比率应按混杂因素进行分层或调整。通常这些...
  • 代码功能介绍在《初探 岭回归 LASSO回归 (python 实现)》中有详细的介绍,文章中若有不正确的,也希望能够不吝赐教,相互学习。
  • 最小二乘法和梯度下降法 之前有讲过线性回归求解的两种方法:最小二乘法和梯度下降法,这两种方法各有优缺点。...数据的归一化和标准化 可以看到归一化是把所有的数据全部缩放到0-1之间,而样本的标准差是所有...
  • #标准化 from sklearn import preprocessing bostonDf_std=pd.DataFrame(preprocessing.normalize(bostonDf,norm='l2', axis=1, copy=True),columns=bostonDf.columns) bostonDf_std.head() from sklearn.model_...
  • 回归分析(stata实例详细解答过程)

    万次阅读 多人点赞 2021-09-02 11:33:47
    现有某电商平台846条关于婴幼儿奶粉的销售信息,每条信息由11个指 标组成。其中,评价量可以从一个侧面反映顾客对产品的关注度。 请对所给数据进行以下方面的分析,要求最终的分析将不仅仅...我们在这里用回归分析,...
  • 【ML】线性回归 の 数据标准化

    千次阅读 2021-11-30 18:01:07
    文章目录1 What:数据标准化 vs 中心化2 Why:为什么要数据标准化3 When:什么时候做/不做数据标准化Do 数据标准化 的情况Undo 数据标准化 的情况线性回归无需标准化 の 数学证明线性回归无需标准化 の 实验证明不...
  • ![图片说明](https://img-ask.csdn.net/upload/201808/18/1534565214_539278.png) 如图,为什么对标准化后的系数除以方差(varX)。对此处进行的数据还原很不理解,恳请知道的大神指点一下!

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 126,370
精华内容 50,548
关键字:

标准化回归