精华内容
下载资源
问答
  • 标准化回归分析
    万次阅读
    2018-07-30 11:21:41

    标准化的回归系数是指将数据标准化(减均值除方差)后计算得到的回归系数。因为数据进行了标准化,因此就取消了量纲的影响。

    假设因变量为y,自变量为x,标准回归系数为a。那么在解释时就要说,当x变化1个标准差是,y变化a个标准差。

    标准化后的回归系数在不同自变量之间是可比的,没有标准化之前是不可比的。

    举一个例子:
    假设因变量是一个人的外貌给人的印象(y),自变量有身高(x1)、体重(x2)
    假如未标准化的回归系数分别为a1、a2。在解释时就要说,在体重不变的前提下,当身高增加1厘米时,y增加a1个单位;在身高不变的前提下,体重(x2)增加1千克,y就增加a2个单位。假设a1>a2,那我们能说身高对一个人的外貌比体重更重要吗?这是不能的,因为身高的1厘米和体重的一厘米对于他们自身来说重要的程度是不一样的。

    必须用标准化的回归系数才能比较,因为那时都是身高或体重增加一个标准差,外貌打分增加多少。这时,身高跟体重都增加了一个标准差,这对于他们自身的重要程度是一样的。 

    更多相关内容
  • 使用spss求标准化的线性回归方程

    千次阅读 2021-11-05 09:48:13
    1 要求标准化的线性回归方程先要有标准化的数据 2 点击 分析–>描述统计–>描述 3勾选如图 4 选择欲标准化的数据 5 确定,得到标准化的数据 6 按照求普通线性回归方程的步骤对标准化的数据求回归方程 7 得到...

    1 要求标准化的线性回归方程先要有标准化的数据
    2 点击 分析–>描述统计–>描述
    3勾选如图
    在这里插入图片描述
    4 选择欲标准化的数据
    5 确定,得到标准化的数据
    6 按照求普通线性回归方程的步骤对标准化的数据求回归方程
    7 得到标准化的线性回归方程

    展开全文
  • 关于回归分析中的数据标准化以及标准化和非标准化回归系数的问题。

         我们在用SPSS做多元线性回归分析时,其结果是看标准化系数还是非标准化系数呢?分析之前要不要对数据标准化?不同影响因素的单位不同,要不要统一单位或对数据标准化呢?

        第一,回归分析反映的是变量之间的关系,即X变化一个单位而Y变化几个单位,因此,如无特别需要,可以直接用各变量的原始数据进行分析,而无需对数据统一单位或数据标准化。

        第二,SPSS等软件的回归分析自动输出标准化和非标准化的系数,因此可以直接获得标准化和非标准化的系数,而无需事先对数据标准化之后再进行回归分析。

        第三,如果想知道解释变量之间谁对因变量影响更大,那么一个简单的做法是比较标准化系数,但这种方法也只是基于简单的观察和比较而不是统计检验,例如标准化回归系数0.35与0.33之间的差异并不一定具有统计学意义。

         第四,当解释变量是分类变量时,标准化回归系数难以做出有意义的解释,此时用非标准化系数更好解释。

          第五,在做实际预测时,要使用非标准化系数和截距,也就是建立非标准化回归方程,而不是标准化回归方程。

    展开全文
  • 回归方程中的两个变量是随机的并且存在误差,即不受研究者控制时,应使用模型II 回归。 当变量都包含误差时,使用普通最小二乘法的模型 I 回归低估了变量之间线性关系的斜率。 根据 Sokal 和 Rohlf (1995) 的说法...
  • 将原始的连续型变量转化为一个无量纲的标准化数值,消除不同变量之间因性质、量纲、数量级等属性的差异而带来的影响,从而使不同变量的效应大小具有可比性,因此数据的标准化处理在实际的统计分析中也得到了较为广泛...

    在前期内容中,我们介绍了如何对数据进行标准化处理,将原始的连续型变量转化为一个无量纲的标准化数值,消除不同变量之间因性质、量纲、数量级等属性的差异而带来的影响,从而使不同变量的效应大小具有可比性,因此数据的标准化处理在实际的统计分析中也得到了较为广泛的应用。

    那么,提到不同变量的效应大小,大家一定会联想到在多因素回归模型中所得到的回归系数。例如,我们假设自变量分别为身高和体重,根据回归系数很容易就知道每增加1cm的身高或每增加1kg的体重,引起的对因变量Y的影响大小,但是两者相比之下,到底谁的作用大谁的作用小呢?

    原始的回归系数已经无法回答这样的问题,我们需要借助标准化回归系数来进行判断,今天我们就来向大家介绍一下,在回归模型中这个标准化回归系数到底是个什么鬼?

    标准化回归系数

    VS

    未标准化回归系数

    1、未标准化回归系数

    通常我们在构建多因素回归模型时,方程中呈现的是未标准化回归系数,它是方程中不同自变量对应的原始的回归系数。它反映了在其他因素不变的情况下,该自变量每变化一个单位对因变量的作用大小。通过未标准化回归系数和常数项构建的方程,便可以对因变量进行预测,并得出结论。

    2、标准化回归系数

    而对于标准化回归系数,它是在对自变量和因变量同时进行标准化处理后所得到的回归系数,数据经过标准化处理后消除了量纲、数量级等差异的影响,使得不同变量之间具有可比性,因此可以用标准化回归系数来比较不同自变量对因变量的作用大小。

    通常我们主要关注的是标准化回归系数的绝对值大小,绝对值越大,可认为它对因变量的影响就越大

    3、两者的区别

    未标准化回归系数体现的是自变量变化对因变量的绝对作用大小,而标准化回归系数反映的是不同自变量对因变量的相对作用大小,可以显示出不同自变量对因变量影响的重要性。

    如果用标准化回归系数构建方程,得到的结论是有偏差的,因为此时自变量和因变量的数据都发生了转化,成为了标准化数据,因此标准化回归系数不能用于构建回归方程。

    标准化回归系数

    VS

    每变化1个标准差的回归系数

    我们在前期文章《回归模型中引入连续变量,还有哪些玩法?》中,介绍到对于连续型变量,在纳入多因素回归模型中时,可以将其转变为每变化1个标准差的形式,具体的操作方法是对原始的自变量进行标准化处理,然后再带入到回归模型中,所得到的回归系数即为该自变量每变化1个标准差对应的回归系数。

    那么,我们假设此时有两个自变量,一个自变量的标准差为1,另一个自变量的标准差为100,两者对因变量都具有一定的影响。如果用上述每增加1个标准差对应的回归系数,来判断哪个自变量对因变量的影响更大的话,当同样变化1个标准差时,第一个自变量只需要改变1个单位,而第二个自变量则需要改变100个单位,因此标准差大的自变量改变起来就显得比较困难。此时,我们就需要用标准化回归系数来救场。

    每增加1个标准差对应的回归系数,反映的是自变量每变化1个标准差时对因变量原始值变化产生的影响。而标准化回归系数,它反映的是自变量每变化1个标准差时,对因变量变化1个标准差产生的影响。

    在计算每增加1个标准差对应的回归系数时,我们只需要对原始自变量进行标准化处理;而如果要计算标准化回归系数,则需要对原始的自变量和因变量同时进行标准化处理,标准化为标准正态分布对应的值后再构建回归模型。

    SPSS操作

    一、研究实例

    某研究人员收集了100名研究对象的最大摄氧量(VO2 max),并记录了他们的年龄、体重、心率等信息,拟探讨年龄、体重、心率对VO2 max的作用大小,同时评价上述哪一个因素对VO2 max的影响作用更大。

    e81554fa3fa7a6d58bfac4fde92b73f6.png

    二、操作步骤

    1、多重线性回归

    (操作步骤参考文章《SPSS实例教程:多重线性回归,你用对了么?》)

    4e3261c47bf83d2fd6862c91c4cd6529.png

    根据多重线性回归分析的结果,回归方程可写为:

    VO2 max = 72.581 – 0.188 * age – 0.184 * weight – 0.059 * heart_rate

    其实不难发现,在SPSS的回归结果中,不仅展示了未标准化回归系数(Unstandardized Coefficients),同时也得出了标准化回归系数(Standardized Coefficients)。

    注意,未标准化回归系数更大的自变量,其标准化回归系数不一定更大。例如本例中,age的未标准化回归系数绝对值为0.188,大于weight的绝对值0.184,但是weight的标准化回归系数绝对值为0.325,却大于age的标准化回归系数绝对值0.200,说明weight对于VO2 max的影响较age更大。

    2、数据标准化处理

    (操作步骤参考前期推送文章《你听说过数据标准化处理吗?》)

    虽然SPSS在回归结果中可以直接输出标准化回归系数,但为了加深对它的理解,我们可以亲自对数据进行一遍标准化处理,对上述结果进行一下验证。

    Analyze → Descriptive Statistics → Descriptives → Save standardized values as variables

    通过上述步骤分别生成4个标准化处理后的新变量。

    f0abc1f94b885cb86162bb5a999efc43.png

    3、标准化回归系数

    在进行多重线性回归时,以VO2 max的标准化形式作为因变量,以age、 weight、 heart_rate的标准化形式作为自变量构建模型。结果发现,所得的结果与上述结果一致。

    50ce5eb2c189d25da6cdede590c9a234.png 30fca3bb9acb7c0ab05551cc65d7df93.png

    相互转换关系

    今天我们介绍了未标准化回归系数、每变化1个标准差的回归系数、以及标准化回归系数,最后再跟大家补充一下三者之间的相互转换关系。

    每变化1个标准差的回归系数= 未标准化回归系数 * 该自变量的标准差

    标准化回归系数= 未标准化回归系数 * 该自变量的标准差 / 因变量的标准差

    大家可以根据上述转换关系自行进行验证哈。

    哦,对了,细心的同学会发现,在SPSS中多重线性回归可以直接输出标准化回归系数,但是在logistic回归中,SPSS只能输出原始的未标准化的回归系数,如果我们想要计算logistic回归的标准化回归系数,比较不同自变量对因变量的相对作用大小,应该怎么办呢?

    根据上述标准化回归系数的转换关系,在logistic回归中随机变量分布函数的标准差为π / √3 = 1.8138[1],故标准化回归系数 = 未标准化回归系数 * 该自变量的标准差 / 1.8138,即可计算logistic回归的标准化回归系数。

    参考文献

    [1] 宋娜. 多元Logistic分布及其参数估计[D]. 北京工业大学, 2007.

    医咖会微信:medieco-ykh

    关注医咖会,及时获取最新统计教程

    展开全文
  • setwd(“D:\R\myrfile”) getwd()———–逐步回归——————read.table("demo.csv",header=TRUE,sep=...scale.demo(demo[,c("a1","a2","a3","a4","a5","a6","y")],center = T,scale = T)#标准化数据 scale.demo cb
  • 本文介绍回归模型的原理知识,包括线性回归、多项式回归和逻辑回归,并详细介绍Python Sklearn机器学习库的LinearRegression和LogisticRegression算法及回归分析实例。进入基础文章,希望对您有所帮助。
  • [回归分析][9.5]--标准化系数

    千次阅读 2016-11-22 21:56:50
    [线性回归][9.5]--标准化系数  作用:当拟合时数据单位不一样时,得到的回归系数大小没有可比性(不能比较谁比较重要),这时就要计算标准话系数。  这里就讲一下标准化系数的求法。   lm = LinearModelFit[data...
  • 第2章 回归分析 1.回归分析 2.回归分析的实例 3.回归分分析程中的注意事项 4.标准化残差 5.内插法和外插法 6.序列相关 7.直以外的回归方程 第3章 重回归分析 1.重回归分析的定义 2.重回归分析的实例 3.重回归分析...
  • MATLAB回归分析

    千次阅读 2014-12-30 07:35:35
    1.计算每年每一个变量的基本统计量:均值,标准差,中位数;并用折线图给出原始数据和均值、中位数的变化趋势。 由所给的《中国企业商品价格指数数据99年至今》数据,利用MATLAB,很容易计算出结果,并画出折线图。...
  • 研究一个随机变量Y对另一个(X)或一组(X1,X2,…,Xk)变量的相依关系的统计分析方法。 应用回归预测法时应首先确定变量之间是否存在相关关系。如果变量之间不存在相关关系,对这些变量应用回归预测法就会得出错误的结果...
  • 转:线性回归标准化与R、T、F

    千次阅读 2020-12-17 09:54:34
    转自:https://blog.csdn.net/jinruoyanxu/article/details/51628441?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-1.control&...1、标准化 对于多元线性回归需要对各个自
  • 【机器学习】回归过程中的数据标准化

    万次阅读 多人点赞 2018-05-01 14:12:13
    最近一直很困惑,因为有些资料在进行回归的时候,往往需要数据标准化。然而也有些资料说对于线性回归是不需要标准化。在查询了大量的资料后,准备在这篇博客上做一个总结。 为什么要数据标准化 数据标准化的原理...
  • 数据分析时经常需要数据标准化处理,常见的比如:回归、主成分、因子分析等,在神经网络、聚类分析中也会经常用到数据标准化预处理,甚至感觉一切的数据分析好像都需要标准化预处理。 数据标准化的作用主要时消除...
  • 在主成分分析法中,一般来说,我们进行的第一步应该是对所有样本数据进行中心化,甚至是标准化处理。那么我们为什么要对样本数据进行中心化和标准化处理呢? 在一般的实际问题当中,我们要分析的数据一般是多个维度...
  • 多重线性回归分析SPSS操作与解读

    千次阅读 2020-12-19 08:55:17
    转自个人微信公众号【Memo_Cleon】的统计学习...在线性回归中,残差是一个非常重要的概念,它是估计值与观测值之差,表示因变量中除了分析的自变量外其他所有未进入模型的因素引起的变异,即不能由分析自变量估计...
  • 标准回归系数引用

    千次阅读 2020-12-20 01:53:15
    举例如下(附do文件及结果):reg y x1-x6 与 reg y x1-x6,beta结果回归系数一样,但前者没有显示标准回归系数,并且后者的标准系数也没有办法贮存在变量或matrix中,这是我比较关心的但通过将数据标准化后,...
  • 如何使用SPSS进行相关性和回归分析

    万次阅读 2021-11-14 17:01:16
    下面用SPSS采用回归—线性分析的方式来分析一下:居民总储蓄 和 “居民总消费”情况是否具备相关性,如果具备相关性,那相关关系的密切程度为多少。 下面以“居民总储蓄”和“居民总消费”的调查样本做统计分析,...
  • SPSS19.0实战之多元线性回归分析

    千次阅读 2020-12-24 14:09:03
    线性回归数据(全国各地区能源消耗量与产量)来源,可点击协会博客数据挖掘栏:国泰安数据服务中心的经济研究数据库。1.1 数据预处理数据预处理包括的内容非常广泛,包括数据清理和描述性数据汇总,数据集成和变换,...
  • 最小二乘法和梯度下降法 之前有讲过线性回归求解的两种方法:最小二乘法和梯度下降法,这两种方法各有优缺点。...数据的归一化和标准化 可以看到归一化是把所有的数据全部缩放到0-1之间,而样本的标准差是所有...
  • 基于线性回归对棉花单产与要素投入的分析利用向后逐步回归同时使用标准化回归系数,即可得到在显著性为0.05下,灌溉费对投入是最重要的因素。
  • 展开全部β也就是beta,代表回归系数,标准化回归系数代表自变量也就是预测变量和因变量的636f70793231313335323631343130323136353331333366306561相关,为什么要标准化,因为标准化的时候各个自变量以及因变量的...
  • 标准化发病率(SIR)或死亡率(SMR)是观察病例和期望病例的比率。观察到的病例是队列中病例的绝对数量。期望病例是通过将队列中的人-年数与参考人口比率相乘得出的。该比率应按混杂因素进行分层或调整。通常这些...
  • 回归分析(stata实例详细解答过程)

    万次阅读 多人点赞 2021-09-02 11:33:47
    现有某电商平台846条关于婴幼儿奶粉的销售信息,每条信息由11个指 标组成。其中,评价量可以从一个侧面反映顾客对产品的关注度。 请对所给数据进行以下方面的分析,要求最终的分析将不仅仅...我们在这里用回归分析,...
  • logistic回归分析优点_二元Logistic回归

    千次阅读 2020-11-21 02:46:52
    点击上方蓝字关注我们在社会科学的研究中,经常会遇到二元变量的情况,例如死亡或未死亡、购买或未购买等,对于二元变量,无法直接采用一般的多元线性模型无法进行回归分析,因为残差不满足正态性、无偏性、共方差性...
  • 回归分析是什么?回归是一种数据分析方法,研究两个或多个变量之间的关系。不同于上一篇所讲的相关分析,回归分析能确定Y与X间的定量关系表达式(回归方程),因此,它可以揭示各个X对Y的影响程度大小 帮助建立预测...
  • 多元线性回归分析(Stata)

    万次阅读 多人点赞 2022-01-14 10:12:47
    回归分析的介绍与分类 回归分析的任务是:通过研究自变量X和因变量Y的关系,尝试去解释Y的形成机制,进而达到通过X去预测Y的目的 三个关键字:相关性、因变量Y、自变量X 常见的回归分析有五类(划分的依据是因...
  • 如何用python进行回归分析

    千次阅读 2020-11-30 02:00:26
    广告关闭腾讯云11.11云上盛惠 ,... 本文讲述如何用python进行基本的数据拟合,以及如何对拟合结果的误差进行分析。 本例中使用一个2次函数加上随机的扰动来生成500个点,然后尝试用1、2、100次方的多项式对该数据...
  • 注明: 本文主要参考https://stats.stackexchange.com/questions/29781/when-conducting-multiple-regression-when-should-you-center-your-predictor-varia中的...,我们再做线性回归时并不需要中心化和标准化数据...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 82,238
精华内容 32,895
关键字:

标准化回归分析