-
量纲对回归结果的影响_如何评价多元线性回归模型的优劣
2021-01-05 06:18:25一个多元回归模型建好后,如何评价模型的优劣呢?1. F值检验因变量的总变异(数据与均值之差的平方和,记为SStotal)由回归平方和(因变量的变异中可以由自变量解释的部分,记为SSR)与误差平方和(记为SSE)构成,如果自...多元线性回归模型是一种简单而且有效的数学模型,一直在各领域广泛使用。一个多元回归模型建好后,如何评价模型的优劣呢?
1. F值检验
因变量的总变异(数据与均值之差的平方和,记为SStotal)由回归平方和(因变量的变异中可以由自变量解释的部分,记为SSR)与误差平方和(记为SSE)构成,如果自变量引起的变异大于随机误差引起的变异,则说明因变量与至少一个自变量存在线性关系。回归平方和与误差平方和的比值记为F,F值服从F分布,通过查F分布概率表可得F值对应的概率,从而判断是否存在统计学意义。F值越大越好。
2. 偏回归系数检验
通过了F检验只说明因变量至少和一个自变量存在线性关系,但不是所有x都跟y存在线性关系。对每个变量的回归系数分别作t检验,假设回归系数为0,得到的概率值越小越好,一般取0.05作为临界值。
3. 标准化偏回归系数
y和x均经过标准化,均值为0,标准差为1,此时的回归结果常数项为0.消除了量纲的影响,更能直观表示自变量对因变量的影响。如果某项回归系数接近0,则说明该自变量与因变量的不具有线性关系,应当剔除。
4. 复相关系数R
指的是因变量与因变量的估计值(回归后得出的值)之间的简单线性相关系数,范围在0-1之间,一般来说,R值应大于0.9,但在某些社会科学研究中只要求R大于0.4,这是因为在社会科学研究中存在大量对因变量有影响却无法进行量化的因数,无法纳入模型研究。值得注意的是,即使向模型增加的变量没有统计学意义,R值也会增加,所以R值只作为参考。
5. 决定系数R2
因变量总变异中由模型中自变量解释部分的比例。也是越大越好,但是存在与R同样的问题。
R2=SSR/SStotal=1-SSE/SStotal
6.校正的决定系数R2adj
将自变量的个数纳入了考量范围,解决了R2 的局限性,不会随着自变量的增加而增加。当模型中增加的自变量缺乏统计学意义时,校正的决定系数会减小。该项系数越大越好。
R2adj=1-(n-1)(1- R2)/(n-p-1) n表示样本量,p表示模型中自变量个数
7.剩余标准差
误差均方的算术平方根,该值应明显小于因变量的标准差,越小越好。说明在引入模型自变量后,因变量的变异明显减小。
8. 赤池信息准则AIC
包含两部分,一部分反映拟合精度,一部分反映模型繁简程度(自变量个数越少模型越简洁),该值越小越好。值得注意的是,用最小二乘法拟合模型与用最大似然估计拟合的模型,其AIC计算方法是不一样的,所以用AIC进行模型比较时应注意拟合的方法是相同的才行。
最小二乘法拟合时:AIC=nln(SSE/n)+2p
最大似然估计拟合时:AIC=-2ln(L)+2p L为模型的最大似然函数
以上8种数据很多统计软件都能方便地输出。
9.预测效果
在数据量较大时,可留一部分数据用作预测,根据预测结果判断模型优劣。
-
多元logit模型实例_【2030.】多元回归中交互作用的评价
2021-01-14 12:15:47交互作用的理解看上去很简单,但需要注意的是交互作用的评价与作用的测量方法有关,也就是与结局变量的类型有关。一般结局变量有定量变量、定性变量两种情况。下面分别举例说明:情况1、结局变量为定量变量 以吸烟...
交互作用的概念简单地说,交互作用指当两个因素都存在时,它们的作用大于或小于各自作用的和(大于的情况就是我们常说的协同,小于的情况就是我们常说的拮抗)。交互作用的理解看上去很简单,但需要注意的是交互作用的评价与作用的测量方法有关,也就是与结局变量的类型有关。一般结局变量有定量变量、定性变量两种情况。下面分别举例说明:情况1、结局变量为定量变量以吸烟(smoke)和饮酒(alcohol)对收缩压(SBP)的影响为例。一般大家都是建立以下多元线性回归模型:SBP=β0+β1*alcohol+β2*smoke
那么什么是交互作用呢?根据吸烟与饮酒将研究对象分成四组,各组SBP的均数可用下表表示:
吸烟与饮酒对SBP的影响,有无交互作用反映在β12上,检验β12是否等于零就是检验吸烟与饮酒对SBP的影响有无交互作用。而上面的案例中的多元线性回归模型是假设β12等于零所做的回归方程。情况2、结局变量为定性变量
以吸烟(smoke)和饮酒(alcohol)对高血压患病率的影响为例。一般大家都是建立以下多元Logistic回归模型:logitP=β0+β1*alcohol+β2*smoke
交互作用存在以下两种情况:(1)相加模型:
(2)相乘模型:
相加模型检验Isa是否等于0,相乘模型检验B是否等于1,可以想象Isa等于零时,B不一定等于1,因此会出现按不同的回归模型检验得出的结论不同。在报告交互作用检验结果时,要清楚所用的是什么模型。一般的线性回归的回归系数直接反映因变量的变化,是相加模型。而Logistic回归由于P值经过logit转换,是反映比值比的变化,属相乘模型。有一个情况大家没有考虑到:既然logistic回归或Cox回归模型为相乘模型,那乘积项的参数检验只能检验因素间是否有相乘交互作用,而无法检验是否存在相加交互作用。Rothman和Hosmer用于评价相加交互作用的三个指标,即1、相对超危险度比(RERI);2、归因比(AP);3、交互作用指数(S)。如果无相加交互作用,则RERI和AP的可信区间应包括0,S的可信区间应包含1。那问题来了,这三个指标怎么计算?
Andersson等编制了Excel计算表,输入自变量间的协方差,即可自动获得REPI、AP和S的估计值及其95%置信区间,进而评价因素间是否具有相加交互作用。
协方差的获取在SPSS的操作如下:
不论结局变量是二分类还是多分类,均在多项Logistic回归菜单下进行操作。
Andersson编制的Excel计算表界面如下:(只需录入协方差数据)
Andersson编制的Excel表已经得到世界的认可,大家可以放心使用。论文中注明是使用该表计算的即可。下载链接如下:链接:http://pan.baidu.com/s/1i4LBnAd 密码:dntu松哥:多元回归中经常需要考虑是否存在交互作用。在logistic回归或Cox回归模型中我们常常只关注乘积项的参数检验,以为这就是交互作用的全部。其实不然,相加交互作用往往被忽视。
整理不易,欢迎点亮再看!
---SPSS实战与疑难杂症系列---
【2028.】如何利用SPSS计算总体率与总体均数的95%可信区间
【2027.】SPSSS如何实现哈迪-温伯格平衡(Hardy-Weinberg equilibrium)法则检验
【2026.】R×C列联表(分类数据)的统计分析方法选择与SPSS实现
【2025.】SPSS实现LD50/LC50计算
【2024.】生存分析截断值自动识别软件,超级棒哦!
【2023.】层次分析法帮你选股票
【2022.】简单效应的SPSS实现
【2021.】广义估计方程SPSS实战
【2020.】这种主成分得分图SPSS能够实现吗?
【2019.】卡方分割无需手动,SPSS自动可实现啦!
【2018.】重复测量资料SPSS实战篇
【2017.】SPSS输出结果统计表与统计图的专业性编辑及三线表定制格式赠送!
【2016.】卡方检验之SPSS实现简约版(视频)
【2015.】t检验之SPSS实现简约版(视频)
【2013.】SPSS中如何设置哑变量
【2012.】分层回归之SPSS实践
【2011.】SPSS直接物理拆分为两个文件
【2010.】倾向性评分(PSM)的SPSS24.0实战
【2009.】如何SPSS实现随机分组
【2008.】趋势性卡方检验专题讨论
【2007.】2个因素均为重复测量数据方差分析
【2006.】为什么配对样本t检验,SPSS结果默认输出相关性
【2005.】SPSS软件作图如何去除顶部与右边边框
【2004.】如何让SPSS自动按照四分位数间距分组某变量【技巧】
【2003.】SPSS两独立样本t检验的简易算法(无需原始数据)
【2002.】太伤自尊了,自以为学会了,现在用SPSS连两独立样本t检验都做不好
【2001.】SPSS作图坐标轴不过原点的解决办法
【2000.】临床预测模型SPSS验证实战
------------------------------
-
【数学建模】多元回归分析模型(评价与决策)
2020-08-03 17:26:22多元回归分析模型主要针对数学建模问题中的一些小的子问题进行求解,如果想直接使用请跳转至——四、五 视频回顾 一、算法介绍 回归分析定义: 回归分析是一种统计学上分析数据的方法,目的在于了解两个或多个...多元回归分析模型主要针对数学建模问题中的一些小的子问题进行求解,如果想直接使用请跳转至——四、五
视频回顾一、算法介绍
回归分析定义:
回归分析是一种统计学上分析数据的方法,目的在于了解两个或多个变量间是否相关、相关方向与强度,并建立数学模型以便观察特定变量来预测研究者感兴趣的变量。
回归分析思想:
回归分析的基本思想是:虽然自变量和因变量之间没有严格的、确定性的函数关系,但可以设法找出最能代表它们之间关系的数学表达形式。
多元回归分析的由来:
在自变量很多时,其中有的因素可能对应变量的影响不是很大,而且x之间可能不完全相互独立的,可能有种种互相作用的关系。在这种情况下可用逐步回归分析,进行x因子的筛选,这样建立的多元回归模型预测效果会更好。二、适用问题
- 收入水平与受教育程度、所在行业、工作年限、工作种类的关系。
- 公路客运量与人口增长量、私家车保有量、国民生产总值、国民收入、工农业总产值、基本建设投资额、城乡居民储蓄额、铁路和水运客运量等因素的关系
三、算法总结
四、应用场景举例
以陕西省长武地区1984~1995年的烟蚜传毒病情资料、相关虫情和气象资料为例,建立蚜传病毒病情指数的逐步回归模型,说明逐步回归分析的具体步骤。影响蚜传病毒病情指数的虫情因子和气象因子一共有21个,通过逐步回归,从中选出对病情指数影响显著的因子,从而建立相应的模型。
五、SPSS操作
六、实际案例
七、论文案例片段(待完善)
-
python 多元线性回归_建模回顾之多元线性回归
2020-11-23 03:51:56May 2020刚刚结束了期中考试(噩梦)小伙伴们是否还在考试后的狂欢之中呢~适当放松之后不要忘记我们的建模课程总结喔多元线性回归介绍多元线性回归方程用来描述一个因变量和多个自变量之间的关系,我们常常利用构造...May 2020
刚刚结束了期中考试(噩梦)
小伙伴们是否还在考试后的狂欢之中呢~
适当放松之后
不要忘记我们的建模课程总结喔
多元线性回归介绍
多元线性回归方程用来描述一个因变量和多个自变量之间的关系,我们常常利用构造多元线性回归矩阵解决问题。
多元线性回归矩阵的条件和步骤
条件:
1.服从正态分布
2.无偏性解释
3.同共方差性检验
4.独立性假设
一般步骤:
1.求回归偏导系数建立回归方程
2.检验并评价回归方程及各变量的大小作用
多元线性回归方程的建立
1.最小二乘法
2.求偏导数
3.利用stats、python、matlab等软件处理
多元线性回归方程的检验及评价(指明方程中每一个变量对Y的影响)
1.对回归方程
a.方差分析法
可将回归方程中所有自变量作为一个整体来检验他们与因变量之间是否有线性关系,并对回归方程的预测或解释能力做出综合评价
b.决定系数
自变量能够解释Y变化的百分比,其值越接近一,说明我们的模型拟合效果越好
c.相关系数r
可以度量Y与多个自变量的相关程度,也就是观察值与估计值之间的相关程度
2.对各自变量的假设检验与评价
a.偏回归方程和
b.t检验法
c.标准化回归系数
例题:
每周六晚
19:00-20:00
每周一晚
20:00-?
我们在钉钉,不见不散~
made by 张家辉、郑韫芊
-
python 多元线性回归_模型之母:多元线性回归
2020-11-23 05:24:220x00 前言 在线性回归的前3篇中,我们介绍了简单线性回归这种样本只有一个特征值的特殊形式,并且了解了一类机器...最后还以简单线性回归为例,学习了线性回归的评价指标:均方误差MSE、均方根误差RMSE、平均绝对... -
基于多元线性回归分析法的煤层气含量预测
2020-07-08 06:56:18含气量是煤层气选区评价、储量计算和影响井产能的重要...基于沁水盆地郑庄区块10口煤层气井含气量的测试结果,应用多元统计分析方法结合主要影响因素,探讨各因素对含气量的影响关系,建立了含气量的多元回归预测模型。 -
opencv机器学习线性回归_机器学习中的多元线性回归步骤
2021-01-04 03:11:48多元线性回归的实现步骤和机器学习中的简单线性回归步骤很相似,在评价部分有所不同。你可以用它来找出在预测结果上哪个因素影响力最大,以及不同变量是如何相互关联的。第1步: 数据预处理更多说明可以去这篇文章看... -
量纲对回归结果的影响_模型之母:多元线性回归
2021-01-05 06:18:240x00 前言 在线性回归的前3篇中,我们介绍了简单线性回归这种样本只有一个特征值的特殊形式,并且了解了一类机器...最后还以简单线性回归为例,学习了线性回归的评价指标:均方误差MSE、均方根误差RMSE、平均绝对... -
不同变质程度煤的发热量与水分和灰分的多元线性回归分析
2020-05-13 00:37:20通过收集内蒙、山西等矿区煤的水分、灰分、挥发分及发热量数据,根据挥发分高低对煤变质程度进行分级,并在此基础上,建立煤的发热量与水分、灰分的多元线性回归分析模型。研究结果表明,研究区煤的发热量与水分、灰分呈... -
基于matlab的多元线性回归分析
2020-04-23 14:41:29在社会生活及生产实践中会经常遇到一种...知道了这些,我们就可以对该量变化所反映的相关问题做出分析和评价,并对其未来发展趋势进行预测和控制,这里就要用到数理统计中一个非常重要而普遍的分析方法,即回归分析法。 -
如何衡量多元线性回归模型优劣
2014-11-13 17:11:57最近再做一些多元回归分析方面的分析,但对于得出的回归模型的好坏不知道如何才判断,于是查找了一下相关的教材书籍,找到了张文彤老师写的《SPSS统计分析高级教程》这本书,里面对于回归模型的优劣评价给出来了几点... -
三因素方差分析_医学统计之多元回归分析(三)
2021-01-14 12:19:37医学统计之多元回归分析一、多元线性回归相关介绍在医学统计领域,变量之间的关系常常是需要进行分析的。如血压值与年龄、性别的关系;身高与饮食习惯、年龄的关系;肿瘤预后与救治方法、肿瘤种类的关系等。对于这类... -
机器学习——多元线性回归
2018-11-20 17:24:34线性回归(Linear Regression...只有一个自变量的情况称为简单回归,大于一个自变量情况的叫做多元回归。 回归结果度量(针对回归问题的评价测度): 平均绝对误差(Mean Absolute Error,NAE),对应方法:metrics... -
机器学习-多元线性回归
2020-02-10 11:12:29多元线性回归的实现步骤和简单线性回归很相似,在评价部分有所不同。你可以用它来找出在预测结果上哪个因素影响力最大,以及不同变量是如何相互关联的。 前提:想要有一个成功的回归分析,确认这些嘉定很重要 1、... -
多元逐步回归分析法在煤层含气量预测中的应用
2020-05-23 11:54:17以大佛寺井田4#煤层为例,依据井田勘探阶段测试资料和煤层气井钻孔测试资料,通过相关性分析从诸多影响含气量因素中筛选出主控因素,优选运用多元逐步回归法结合主控因素建立了4#煤层含气量的预测模型,其预测值与实测值... -
r 多元有序logistic回归_R语言Logistic回归模型的外部验证(2)
2021-01-08 09:18:12Logistic回归模型同样也要进行校准度和区分度的评价,关于校准度和区分度的概念就不说了,自行百度把。首先我们得选出两个相同指标的数据集,一个用于建模,一个用于验证,我发现R语言的survival数据集刚好自带... -
2(3)-多元线性回归
2018-08-09 09:09:27执行多重线性回归的步骤几乎与简单线性回归的步骤相似。 差异在于评价。你可以用它来找出哪个因素对预测输出的影响最大,以及不同的变量之间的关系。 假设 对于一个成功的回归分析,验证这些假设是必要的。 * ... -
100天项目 Day3 多元线性回归
2018-12-18 13:54:51多元线性回归的实现步骤和简单线性回归很相似,在评价部分有所不同。 可以用来找出预测结果上哪个特征影响力最大,以及变量之间是如何互相关联的。 回归分析的假设前提: 1. 特征值和预测值应该是线性相关的 ... -
机器学习一百天 第三天 多元线性回归
2019-04-05 20:51:34多元线性回归的实现步骤和简单的线性回归相似,只是在评价部分有所不同。 前提 自变量和因变量的关系是线性 误差项的方差必须等同 多元回归假定残差符合正态分布 缺少多重共线性 虚拟变量 在多元回归... -
【我的python机器学习之路·3】多元线性回归与超市盈利预测
2018-09-03 20:54:04本系列日记GitHub: ... 欢迎follow和star。 多元线性回归寻找的线性方程是在两个及以上的自变量和因变量之间构建关系。多元线性回归的实现步骤和简单线性回归很相似,在评价部分有所不同。公式为: ... -
我国高校专利分类变化的评价模型及其回归分析
2020-06-26 11:35:16通过文献检索和网络调查等定性...利用多元线性回归分析中的逐步回归方法,构建专利申请量的预测模型并与实际数据进行拟合比较,充分验证了该模型的有效性并且根据该模型及其分析给出了国家专利发展战略的有效建议和方案。 -
4.3 模型之母:多元线性回归学习笔记
2020-03-22 21:51:31在线性回归的前3篇中,我们介绍了简单线性回归这种样本只有一个特征值的特殊形式,并且了解了一类机器...最后还以简单线性回归为例,学习了线性回归的评价指标:均方误差MSE、均方根误差RMSE、平均绝对MAE以及R方... -
matlab多元线性回归模型代码_用Matlab建立评分卡模型(之二)——线性回归与逻辑回归...
2020-12-25 00:10:32本来想按照实操上的建模工作顺序,从数据源计算IV和WOE值、变量筛选、逻辑回归到模型评价写这系列文章,但有读者反应读起来有些生涩无聊(请原谅笔者也是第一次写公众号啊/(ㄒoㄒ)/~~)。于是这里插入了本篇,主要就... -
Julia 机器学习 ---- 单变量线性回归 和 多元线性回归 (Linear regression)
2020-07-04 17:25:13目录 1、线性回归概述 2、数据准备 3、数据探索 3.1简单的数据清洗 3.2 图形分析数据 ...3.2.1 盒形图的离群点分析,需要根据四分位距去掉部分数据点。...7.1 模型的预测与评价 7.1.1预测 7.1.2 计算误差 线 -
【统计学习系列】多元线性回归模型(五)——参数与模型的显著性检验:t检验与F检验
2020-03-29 16:57:02文章目录1. 单参数显著性检验——t检验2. 回归方程显著性检验——F检验3. 拟合优度评价指标I——R方/改进R方4. 拟合优度评价指标AIC/BIC/SIC写在最后...欢迎感兴趣的小伙伴来跟作者一起挑刺儿~ 包括但不限于语言上的... -
回归的误差服从正态分布吗_空间研究中会遇到的一些回归问题
2021-01-10 07:57:17要分析评价一些现象,多元线性回归是最基本的分析方法。 一、回归什么?在建筑方面,可以分析人的聚集程度、商场的冷区热区等影响因素;建筑技术方面,有大量分析影响建筑能耗的行为;在规划方面,会分析地块、街道... -
基于回归模型的断层构造复杂度分析
2020-05-17 00:20:52与单一依据分形维数的插值结果相比,利用辅助信息的回归插值模型能够克服断层分形维数不能表达垂向信息的缺点以及断层信息缺失情况下的断层构造复杂度难以评价,提高了断层构造复杂度评价精度。最后对断层构造复杂度... -
基于逐步回归分析的话务预测研究
2020-10-17 03:09:31针对现有话务预测模型变量单一、预测误差大等问题引入了逐步回归分析...随之建立了各影响因素的一元回归模型,并在此基础上得到了多元逐步回归的话务预测模型;最后将此建模方法与其他分析法进行了综合比较并给出评价。 -
逐步回归分析方法在储层参数预测中的应用
2020-06-26 22:40:08因此文中采用逐步回归分析方法作为预测方法,重点介绍了回归分析中的逐步回归的基本思想以及具体计算步骤。最后,提出油气勘探中预测孔隙度的问题,并用逐步回归分析优化回归方程并用此方程预测岩芯属性参数。研究表明,... -
线性回归模型_线性回归模型
2020-12-18 13:41:43线性回归的思想就是试图找到一个多元的线性函数: 当输入一组特征(也就是变量X)的时候,模型输出一个预测值y = h(x),我们要求这个预测值尽可能的准确,那么怎么样才能做到尽可能准确呢?这要求我们建立一个评价...
-
家-源码
-
cascader 动态加载级联数据
-
MySQL NDB Cluster 负载均衡和高可用集群
-
【硬核】一线Python程序员实战经验分享(1)
-
【背包问题】PSO算法求解0/1背包问题【Matlab 328期】
-
mpeg2_chs-fuc.pdf
-
android组件!应聘高级Android工程师历程感言,通用流行框架大全
-
redis分布式锁
-
零基础极简以太坊智能合约开发环境搭建并开发部署
-
C/C++反汇编解密
-
【Python-随到随学】FLask第二周
-
android小游戏!金三银四Android面试的一些感受,快来收藏!
-
基于ZigBee和AODV协议的无线体域网性能仿真
-
使用 Linux 平台充当 Router 路由器
-
华为1+X认证——网络系统建设与运维(初级)
-
MySQL 存储过程(创建海量数据实验环境)
-
投资组合:我的投资组合网站是由盖茨比(Gatsby)建立的-源码
-
android线程池!如何试出一个Android开发者真正的水平?内容太过真实
-
android布局!分享一些行业经验,已整理成文档
-
《无线权威指南》—网络概述:相关术语与设计(一)