精华内容
下载资源
问答
  • logistic回归又称logistic回归分析,是一种广义的线性回归分析模型,常用于数据挖掘,疾病自动诊断,经济预测等领域。例如,探讨引发疾病的危险因素,并根据危险因素预测疾病发生的概率等。 二元logistic回归在临床...

    logistic回归又称logistic回归分析,是一种广义的线性回归分析模型,常用于数据挖掘,疾病自动诊断,经济预测等领域。例如,探讨引发疾病的危险因素,并根据危险因素预测疾病发生的概率等。
    二元logistic回归在临床应用非常广泛,常用于结果是二分类变量的多因素分析,比如:疾病是否发生、阳性或阴性、生存或死亡这类的结果。例如:
    在这里插入图片描述
    在这里插入图片描述
    今天我们来完整演示一下,这类文章的数据是怎么做出来的。我们有一个肺炎和炎症指标的数据,如下图所示:fy为是否发生肺炎,t为痰液图片是否阳性,xs为胸腔积液的量,其他为炎症指标,假如我们想知道肺炎发生的高危因素
    在这里插入图片描述
    我们先打开SPSS,把数据拷贝进去
    在这里插入图片描述
    依次点击:分析-----回归------二元logistic回归
    在这里插入图片描述
    fy放入因变量,其他放入协变量
    在这里插入图片描述
    点击分类,把二分类变量tj放入分类协变量,参考类别选第一个,然后点继续
    在这里插入图片描述
    点击选项,然后勾选置信区间这个选项
    在这里插入图片描述
    最后点击确定,得到如下图结果,显著性就是P值,Exp(B)就是OR值,Exp(B)的95%置信区间就是置信区间,至此,所有的结果都算出来啦,是不是很简单呀!
    在这里插入图片描述
    更多精彩文章,尽在零基础说科研,动动你的小手关注一下吧
    在这里插入图片描述
    科研课程零基础教你写医学论文课程上线啦
    您是否因为没有思路、统计学不好、不知道怎么发核心论文还一筹莫展,论文和科研就是您晋升路上的绊脚石。今天,这些都不是问题,零基础教你写医学论文课程上线啦!原价598元的课程现在优惠价只要298元。名师讲座,48个课时使零基础的你快速上手,拥有无数论文写作思路,变成统计学高手,再也不用羡慕别人能发国内核心论文,自己也能成为别人眼中的羡慕对象。

    在这里插入图片描述
    您还在等什么,赶快点击下方二维码加入课程吧,相信您绝对物有所值。
    在这里插入图片描述

    展开全文
  • logistic回归又称logistic回归分析,是一种广义的线性回归分析模型,常用于数据挖掘,疾病自动诊断,经济预测等领域。 logistic回归的因变量可以是二分类的,也可以是分类的,但是二分类的更为常用,也更加容易...

    logistic回归又称logistic回归分析,是一种广义的线性回归分析模型,常用于数据挖掘,疾病自动诊断,经济预测等领域。

    logistic回归的因变量可以是二分类的,也可以是多分类的,但是二分类的更为常用,也更加容易解释。所以实际中最为常用的就是二分类的logistic回归。

    logistic回归的主要用途:一是寻找危险因素,正如上面所说的寻找某一疾病的危险因素等。二是预测,如果已经建立了logistic回归模型,则可以根据模型,预测在不同的自变量情况下,发生某病或某种情况的概率有多大。三是判别,实际上跟预测有些类似,也是根据logistic模型,判断某人属于某病或属于某种情况的概率有多大,也就是看一下这个人有多大的可能性是属于某病

     

     

     

    Variables in the Equation:
    B S.E. Wald df Sig. Exp(B)
    a .197 .687 .082 1 .774 1.218
    b .445 .639 .484 1 .486 1.560
    d -.134 .212 .401 1 .527 .874
    a by b -.753 .942 .639 1 .424 .471
    b by d .375 .302 1.545 1 .214 1.455
    a by d .956 .350 7.455 1 .006 2.600
    a by b by d-1.336 .464 8.290 1 .004 .263
    Constant -.336 .452 .552 1 .457 .715

     

    系数值(B) 标准误(S.E.) 卡方值(Wald) 自由度(df) P值(Sig.) OR值Exp(B)

    常数(Constant)

     

     

     【 卡方Chi-square 98.556    

    显著性】Sig.0.000 

    分类正确的百分比】Percentage Correct 76.8

    nagelkerkeR方】Nagelkerke R Square 0.154 

     

     

    R表示的是拟合优度,它是用来衡量估计的模型对观测值的拟合程度。它的值越接近1说明模型越好。但是,你的R值太小了。

    T的数值表示的是对回归参数的显著性检验值,它的绝对值大于等于ta/2(n-k)(这个值表示的是根据你的置信水平,自由度得出的数值)时,就拒绝原假设。即认为在其他解释变量不变的情况下,解释变量X对被解释变量Y的影响是显著的。

    F的值是回归方程的显著性检验,表示的是模型中被解释变量与所有解释变量之间的线性关系在总体上是否显著做出推断。若F>Fa(k-1,n-k),则拒绝原假设即认为列入模型的各个解释变量联合起来对被解释变量有显著影响,反之,则无显著影响。

    线性回归的回归系数: 一般地,要求这个值大于5%。对大部分的行为研究者来讲,最重要的是回归系数。年龄增加1个单位,文档的质量就下降 -.1020986个单位,表明年长的人对文档质量的评价会更低。

    这个变量相应的t值是 -2.10,绝对值大于2,p值也<0.05,所以是显著的。结论是,年长的人对文档质量的评价会更低,这个影响是显著的。

    相反,领域知识越丰富的人,对文档的质量评估会更高,但是这个影响不是显著的。这种对回归系数的理解就是使用回归分析进行假设检验的过程。————————————————————————————————————————

    首先来说明各个符号,B也就是beta,代表回归系数,标准化的回归系数代表自变量也就是预测变量和因变量的相关,为什么要标准化,因为标准化的时候各个自变量以及因变量的单位才能统一,使结果更精确,减少因为单位不同而造成的误差。T值就是对回归系数的t检验的结果,绝对值越大,sig就越小,sig代表t检验的显著性在统计学上,sig<0.05一般被认为是系数检验显著,显著的意思就是你的回归系数的绝对值显著大于0,表明自变量可以有效预测因变量的变异,做出这个结论你有5%的可能会犯错误,即有95%的把握结论正确。
    回归的检验首先看anova那个表,也就是F检验,那个表代表的是对你进行回归的所有自变量的回归系数的一个总体检验,如果sig<0.05,说明至少有一个自变量能够有效预测因变量,这个在写数据分析结果时一般可以不报告。
    然后看系数表,看标准化的回归系数是否显著,每个自变量都有一个对应的回归系数以及显著性检验

    展开全文
  • SPSS实例教程:有序分类Logistic回归

    万次阅读 多人点赞 2017-10-29 22:38:21
    SPSS实例教程:有序分类Logistic回归 医小咖 10 个月前 1、问题与数据 在某胃癌筛查项目中,研究者想了解首诊胃癌分期(Stage)与患者的经济水平的关系,以确定胃癌筛查的重点人群。为了避免性别因素对结论的...

    SPSS实例教程:有序多分类Logistic回归

    医小咖医小咖
    10 个月前

    1、问题与数据

    在某胃癌筛查项目中,研究者想了解首诊胃癌分期(Stage)与患者的经济水平的关系,以确定胃癌筛查的重点人群。为了避免性别因素对结论的混杂影响,研究者将性别(Sex)也纳入分析(本例仅为举例说明如何进行软件操作,实际研究中需控制的混杂因素可以更多)。研究者将所有筛查人群的结果如表1,变量赋值如表2。

    表1. 原始数据


    表2. 变量赋值情况


    2、对数据结构的分析

    该设计中,因变量为四分类,且分类间有次序关系,针对因变量为分类型数据的情况应该选用Logistic回归,故应采用有序多分类的Logistic回归分析模型进行分析。

    有序多分类的Logistic回归原理是将因变量的多个分类依次分割为多个二元的Logistic回归,例如本例中因变量首诊胃癌分期有1-4期,分析时拆分为三个二元Logistic回归,分别为(1 vs 2+3+4) 、(1+2 vs 3+4)、(1+2+3 vs 4),均是较低级与较高级对比。需注意的是,有序多分类Logistic回归的假设是,拆分后的几个二元Logistic回归的自变量系数相等,仅常数项不等。其结果也只输出一组自变量的系数。

    因此,有序多分类的Logistic回归模型中,必须对自变量系数相等的假设进行检验(又称平行线检验)。如果不满足平行线假设,则考虑使用无序多分类Logistic回归或其他统计方法。

    3、SPSS分析方法

    (1)数据录入SPSS

    首先在SPSS变量视图(Variable View)中新建四个变量:ID代表患者编号,Sex代表性别,Income代表收入水平,Stage代表首诊胃癌分期。赋值参考表1。然后在数据视图(Data View)中录入数据。

    (2)选择Analyze → Regression → Ordinal Logistic


    (3)选项设置

    将因变量Stage放入因变量(Dependent)位置,自变量性别(Sex)、收入水平(Income)为分类变量,故放入因子(Factors)位置。若研究中还有连续型变量需要调整,则放入协变量(Covariate)位置。

    点击输出(Output)选项,勾选平行线检验(Test of parallel lines)。其余选项维持默认。点击确定(OK)。


    4、结果解读

    (1)Case Processing Summary

    给出的是数据的一般情况,这里不进行介绍。

    (2)模型拟合优度检验

    有两个,一个是似然比检验结果(Model Fitting Information).该检验的原假设是所有纳入自变量的系数为0,P(Sig.)<0.001,说明至少一个变量系数不为0,且具有统计学显著性。也就是模型整体有意义。

    另一个结果是拟合优度检验(Goodness-of-Fit)结果,提供了Pearson卡方和偏差(Deviance)卡方两个检验结果。但是,这两个检验结果不如上图的似然比检验结果稳健,尤其是纳入的自变量存在连续型变量时,因此推荐以似然比检验结果为准。

    (3)伪决定系数(Pseudo R-Square)

    对于分类数据的统计分析,一般情况下伪决定系数都不会很高,对此不必在意。

    (4)参数估计(Parameter Estimates)

    阈值(Threshold)对应的Stage=1,2,3三个估计值(Estimate)分别是本次分析中拆分的三个二元Logistic回归的常数项。位置(Location)中Sex和Income变量对应的参数估计值为自变量的估计值。其中Income为多分类,在分析中被拆分成了三个哑变量(即Income 取值1、2、3),分别与Income=4的组进行对比。且有序多分类Logistic回归假定拆分的多个二元回归中自变量系数均相等,因此结果只给出了一组自变量系数。

    Income=1系数估计值(Estimate)为-1.617意味着,在调整性别变量的情况下,Income=1(即收入水平最低)的组,相比于Income=4(收入水平最高)的组,初诊胃癌分期至少低一个等级的可能性是exp(-1.617)=0.198倍。其他系数解释相同。这说明,收入水平低的人群,其初诊胃癌时病情更严重。

    Sex变量系数无统计学意义(P=0.428),如果没有其他证据证明不同性别的初诊胃癌分期有区别,那么从模型精简的角度考虑,应当将Sex变量从模型中去掉再次进行回归,得到收入水平的参数估计值。如果研究者比较肯定不同性别初诊胃癌分期会产生区别,那么即使在本研究中其系数无统计学意义也应保留在模型中(因为无统计学意义有可能是因为样本量小造成的,并不能说明该变量不产生影响)。本研究中予以保留。

    (5)平行线假设检验(Test of Parallel Lines)

    该检验的原假设是三个二元Logistic回归自变量系数相等,检验P(Sig.)值为0.052,不拒绝原假设,可以认为假设成立,可以使用多重有序Logistic回归。如果将参数无统计学意义的Sex变量去掉,会发现平行线假定检验P值会增大(P=0.175)(是否去掉Sex变量重回归,取决于是否有充足研究证据证明Sex是一个混杂变量,如果是,Sex变量应保留在模型中)。

    5、结果汇总

    胃癌患者的初诊分期与患者的收入水平有关。低等收入、中等收入与中高等收入人群与高等收入人群相比,初诊胃癌分期低至少一个等级的可能性分别为0.198(P<0.001)、0.310(P<0.001)、0.640(P=0.071)倍。

    (更多内容可关注“医咖会”微信公众号:传播医学知识和研究进展,探讨临床研究方法学。)

    展开全文
  • 1、问题与数据 在某胃癌筛查项目中,研究者想了解首诊胃癌分期(Stage)与患者的经济...该设计中,因变量为四分类,且分类间有次序关系,针对因变量为分类型数据的情况应该选用Logistic回归,故应采用有序分类的Logis

    一、教学内容

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    二、备注

    相关资料已上传我的资源,下载链接https://blog.csdn.net/TIQCmatlab?spm=1011.2124.3001.5343

    展开全文
  • SPSS中,进行二元logistics回归分析

    千次阅读 2017-08-05 16:56:00
    logistic回归为概率型非线性回归模型,是研究分类观察结果(y)与一些影响因素(x)之间关系的一种变量分析方法。 一、准备数据,因变量为二分类数据,自变量为定比数据;分析-回归-二元logistic回归; 二、输出...
  • SPSS(九)Logistic模型族进阶(图文+数据集),案例:工作满意度影响因素分析,有序分类Logistic回归模型
  • 应用SPSS13.0软件进行单因素分析多因素分析,多因素分析应用二值多元Logistic回归模型,以诸多临床因素作为自变量,复发与否作为因变量。结果:经单因素分析患者性别、年龄和术前KPS评分与脑膜瘤复发有明显关系;多因
  • 3. 一元多因素方差分析模型的原理、案例操作和结果解读 4. 多元方差分析模型和重复测量方差分析模型的原理、案例操作方法和结果解读 5. 相应的图形工具在分析中的应用和操作 第三讲 相关分析模型 1. 相关分析的...
  • SPSS V13--破解版

    2011-08-25 17:04:08
    阶段分层整群抽样,或者更复杂的PPS抽样,研究者都可以在该模块中轻松的实现从抽样设计、统计描述到复杂统计建模以发现影响因素的整个分析过程,方差分析模型、线形回归模型、Logistic回归模型等复杂的统计模型...
  • 变量logistic回归分析用于确定产后现代避孕药具使用的独立预测因子。 结果:大多数(97.3%)的参与者知道现代避孕药具。 产后现代避孕药的使用率为11.9%。 最常用的避孕方法是植入6.5%。 绝大多数(75%)的...
  • 多因素logistic回归用于确定与正确的母乳喂养开始时间显着相关的因素,显着性水平设置为p <0.05。 结果:共研究了321对母婴。 86%(26.8%)的受访者在分娩后1小时内正确开始了母乳喂养。 计划中的怀孕,对婴儿...
  • Logistic回归分析显示,来自一夫妻家庭的母亲(OR = 11.786,95%CI,1.990-23.184)的死亡(OR = 5.781,95%CI,3.253-24.371),社会经济地位低下(OR = 6.222, 95%CI,4.705-23.379),有单亲父母(OR = 2....
  • 我们使用描述性统计数据来了解母亲的特征,并使用变量logistic回归模型来获取发育迟缓的决定因素。 使用SPSS 20版对数据进行分析。结果:本研究共纳入372名母亲及其子女。 大多数儿童为6至24个月大,其中307名...
  • 变量logistic回归模型中估算了与使用现代避孕药相关的因素的置信区间为95%的几率。 结果:现代避孕方法的使用率为42.7%。 受雇(OR 2.42,95%CI:1.13-5.18),正规教育程度(OR 2.45,95%CI:1.38-4.35)...
  • 进行单因素和多因素logistic回归分析以分析风险辅助因子。 使用的统计检验是比值比及其置信区间,并且统计显着性阈值设置为p <0.05。 结果:在单因素分析中,与严重不典型增生的发生在统计学上显着相关的辅助...
  • 结果:多元logistic回归模型分析表明,低出生体重与孕产妇中上臂周长小于23 cm(AOR 1.79(95%CI = 1.01-3.16)),孕龄小于37周(AOR 24.94(95) %CI = 12.38-50.27)),怀孕期间存在疟疾感染(AOR 3.02(95%...
  • Stata 9 很好的统计软件

    热门讨论 2008-11-24 11:45:14
     数值变量资料的一般分析:参数估计,t检验,单因素和多因素的方差分析,协方差分析,交互效应模型,平衡和非平衡设计,嵌套设计,随机效应,多个均数的两两比较,缺项数据的处理,方差齐性检验,正态性检验,变量...
  • 卡方检验用于检验显着性关联,并进行二元Logistic回归建模以预测结果。 设定5%的显着性水平(p值)0.05置信区间。 结果:研究结果表明,大多数受访者中有85.6%(317)表示愿意在怀孕期间接受常规HIV检测,尽管...

空空如也

空空如也

1
收藏数 20
精华内容 8
关键字:

多因素logistic回归分析spss