精华内容
下载资源
问答
  • 前面,我们讲了logistic回归,单因素logistic回归分析。今天,我们来讲解一个数据分析的全过程,即所谓的单因素和因素分析。案例:分析有生育障碍的妇女进行注射HCG后卵巢反应的影响因素,研究收集的参与者数据有...

    0e8edc6dc465ba7c55762545c1208259.png

    前面,我们讲了logistic回归,单因素logistic回归分析。今天,我们来讲解一个数据分析的全过程,即所谓的单因素和多因素分析。

    案例:

    分析有生育障碍的妇女进行注射HCG后卵巢反应的影响因素,研究收集的参与者数据有高反应和正常反应共336名。按照传统的统计学分析方法,先单因素分析再多因素分析,此处涉及数据隐私,仅放部分数据。

    b6a11d976e95ea54c44e531e6e12c8dc.png

    [分析]

    以卵巢反应为分组变量,分析的因素有:年龄、吸烟史、不孕类型、妊娠史、BMI、初潮年龄、平均月经周期、不孕持续时间、窦卵泡计数、黄体生成素、MC3雌二醇、MC3孕酮、MC3卵泡刺激素、卵巢反应其中吸烟史、不孕类型和妊娠史为分类资料,其他为连续型资料。

    1 单因素分析

    连续型资料按资料的分布采用t检验或秩和检验,分类资料按数据的类型有卡方检验、秩和检验和秩相关等,详见列联表详解。此研究数据均为无序分类资料,因此仅采用卡方检验或fisher检验即可。

    1.1 对连续的数据进行正态检验,正态的数据采用t检验,偏态的数据采用秩和检验

    8a772268b8c786a3c90e264eeba0be2e.png

    1.2 对分类的资料进行卡方检验

    e6f14bb5db98801b5e2d85161ad41861.png

    注:“-”为采用fisher检验

    2 多因素分析

    6d65bd1b3dbec5f3f2f898c69fb22b1c.png

    可以看出,当因素分析时,仅窦卵泡计数有模型,有统计学意义。因此,我们可以选择换一种回归方式进行logistic回归,此处选择逐步回归(因为只进入了一个因素,因此无论是逐步,向前或向后等方法,结果是一样)。

    0d0adb19d55b726b85b2e86dfd2622c0.png

    解释为,窦卵泡每增加一个,发生卵巢高反应的可能增加0.898倍(OR=1.898,95%CI:1.655-2.176)。

    今天就分析到这里,我们下期再见!

    — THE END —

    f95822eb17c1a382957b7fdcefcb1f00.png
    展开全文
  • R语言单因素/多因素 Logistic回归

    千次阅读 2021-08-28 16:03:39
    变量因子的转换->单因素logistic回归->多因素logistic回归 https://mp.weixin.qq.com/s/NowePGv6DF9_dF4blSyzVQ

    变量因子的转换->单因素logistic回归->多因素logistic回归

    https://mp.weixin.qq.com/s/NowePGv6DF9_dF4blSyzVQ

    两个模型的比较

    构造测试集,预测概率,利用展示因素对结果的影响

    https://mp.weixin.qq.com/s/dcTkiaEsFnL18DH8w64-2g

    展开全文
  • 多因素logistic回归时某一变量(例如BNP)数值跨度很大(个位数到几万都有),最后95%置信区间为(1,1)怎么办?
  • logistic回归分析及SAS实现医学研究中的logistic回归分析及SAS实现
  • 方法:对586例PICC导管插入患者的数据进行回顾性分析,然后对肿瘤患者的一般数据和导管插入数据进行单变量分析,将具有统计学意义的单因素数据纳入多因素Logistic回归模型中。分析。 结果:PICC导管相关的血流感染...
  • 做出ROC和校准曲线, 然而我在复制这个模式时,额外做了一个二元多因素Logistic回归时,得到了4个p的自变量。这4个变量不都在Lasso回归筛选得到的变量中,Lasso回归筛选得到的变量,也不都有显著性。也就是说,逻辑...
  • 因素Logistic回归分析 最近在做的东西涉及个变量进行logistic回归,结果要求输出OR值,OR95%可信区间和P值,编写了相关函数。...- function(var_y,varlist,data){ ##多因素logistic回归 in_formula <-

    单因素Logistic回归分析

    转载请注明出处。

    最近在做的东西涉及多个变量进行logistic回归,结果要求输出OR值,OR95%可信区间和P值,编写了相关函数。
    函数名:logistic_sig
    函数参数及输入含义

    1. var_y 结果变量名,需要加引号
    2. varlist 需要分析的变量名列表,以 c(“a”,“b”)这种形式
    3. data 数据集名

    函数代码

    logistic_sig <- function(var_y,varlist,data){ ##多因素logistic回归
      in_formula <- as.formula(paste(var_y,"~",varlist)) 
      p <- glm(in_formula,family=binomial(link=logit),data=data)
      coeff <- summary(p)$coefficients
      beta <- coeff[,1]
      LCI <- coeff[,1] -coeff[,2]*1.96 
      UCI <- coeff[,1] +coeff[,2]*1.96 
      OR <- round(exp(beta),2)
      OR_LCI <-round(exp(LCI),2)
      OR_UCI <- round(exp(UCI),2)
      p_value <- round(coeff[,4],3)
      name <- var
      data_var <- data.frame(OR,OR_LCI,OR_UCI,p_value)
      data_var <- data_var[-1,]
      return(data_var)
    }
    

    代码使用案例

    var <-c("sex","age","BMI")
    data_log <- logistic_sig("AE",var[1],data1)
    for (i in 2:length(var)) {
      data_cur <- logistic_sig("AE",var[i],data1)
      data_log <- rbind(data_log,data_cur)
    }
    

    输出结果形式
    在这里插入图片描述

    展开全文
  • 作者:牟海燕 封面:自己想吧文献概要本篇文献采用自编一般情况调查表及焦虑自评量表(SAS)对某医院100个糖尿病前期患者进行了调查,根据SAS得分将100个患者分为焦虑组(...,了解糖尿病前期患者焦虑现状、分析影响因素...

    f90c4209af6ee8c42a0df8783c63a808.gif

    作者:牟海燕    封面:自己想吧

    1b8db5129872cdc037b1e8b57519002a.png 文献概要

    本篇文献采用自编一般情况调查表及焦虑自评量表(SAS)对某医院100个糖尿病前期患者进行了调查,根据SAS得分将100个患者分为焦虑组(22例)和非焦虑组(78例),了解糖尿病前期患者焦虑现状、分析影响因素。以α=0.05的检验水准判断变量是否有统计学意义。

    1b8db5129872cdc037b1e8b57519002a.png

    主要统计学方法

    计量资料采用Shapiro-Wilk检验进行正态性检验;正态分布的计量资料以(x±s)表示,两组间比较采用独立样本t检验;非正态分布的计量资料以M(P25,P75)表示,两组间比较采用非参数检验;计数资料采用相对数表示,组间比较采用χ2检验或Fisher's确切概率法;采用Spearman秩相关进行相关性分析;采用多因素Logistic回归分析糖尿病前期患者焦虑的影响因素。

    即本文采用的主要统计学方法有:定量资料的正态性检验、两独立样本t检验、非参数检验、两独立样本的卡方检验或Fisher's确切概率法、spearman秩相关和Logistic回归。

    下面小编对本文使用的主要方法进行简要介绍。

    (1)正态性检验

    许多统计学方法都要求数据满足正态分布,如常用的t检验、方差分析、线性回归等。进行正态性检验的方法很多,大致分为3类:(1)经验法。(2)图示法。例如直方图、P-P图、Q-Q图,采用图示法时样本量最好比较大。(3)检验法。例如S-W检验(W检验)、K-S检验(D检验)等。

    (2)两独立样本t检验

    两独立样本t检验用于比较两组服从正态分布的定量变量的总体均数是否有差别,若以α=0.05的检验水准,则α>0.05接受H0,表示两总体的均数无差别,α<0.05拒绝H0,表示两总体的均数有差别。

    (3)非参数检验

    参数检验是在已知总体分布类型的基础上,对总体参数进行估计和检验,如:t检验,F检验,U检验等。非参数检验(的适用范围很广,总体分布类型未知或非精确测量资料(如等级资料)或参数检验的条件得不到满足时,对资料的分布规律及特征进行统计推断。如:秩和检验、卡方检验、游程检验、序贯检验和Ridit分析等都是非参数检验。

    非参数检验的主要优点是对资料的要求不像参数检验那样严,适合处理非正态、方差不齐,以及分布类型不明确等资料。其次,有些问题本身还没有适当的参数检验方法可用,而非参数检验法则能予以处理。

    非参数检验的不足之处是,由于它对原始数据所包含的信息利用不充分,检验效率就低了。尤其是对适宜用参数检验法处理的资料,若用非参数法分析,一般犯第二类错误的概率比参数检验大。故适宜用参数检验法的资料,应首选参数检验法。

    (4)两独立样本的卡方检验或Fisher's确切概率法

    卡方检验可用于对分类资料的率或构成比进行检验。Fisher确切概率检验的理论基础为超几何分布,不属于卡方检验范畴,但是当卡方检验不适合时可用Fisher确切概率法。在适用卡方检验对率或构成比进行检验时,若出现以下情况,⑴p≈α;⑵T(理论频数)<1;⑶n<40;⑷n≥40,但1≤T<5则使用Fisher确切概率法。

    (5)spearman秩相关

    衡量两变量之间相关性的参数主要有pearson积差相关系数、spearman等级相关系数。pearson积差相关系数适用于描述服从双变量正态分布的两随机变量;spearman等级相关系数的适用范围则较广,对数据的要求也低一些,可用于不服从双变量正态分布的变量、总体分布类型未知或者一个变量数据是等级变量,另一个是连续型变量。

    (6)Logistic回归

    当因变量为分类变量时,研究影响因变量的因素可使用Logistic回归。Logistic回归的反应变量为二分类变量,自变量定性或定量均可。在研究中,一般设效应指标y=1为发生,y=0为不发生。对于无序分类变量可设置哑变量,使模型的解释更为合理。注意Logistic回归对样本量的要求比线性回归要大得多,样本量一般需要为自变量个数的20倍以上。

    1b8db5129872cdc037b1e8b57519002a.png 问卷结果分析

    (1)一般情况

    100例糖尿病前期患者中,男58例(58.0%),女42例(42.0%);年龄30~75岁,平均年龄(54.3±15.6)岁;焦虑组22例,非焦虑组78例(78.0%)。

    (2)两组一般资料比较

    两组患者性别、年龄、婚姻、职业、文化程度、医疗保险类型、吸烟、饮酒、颈动脉硬化、下肢动脉硬化、尿微量白蛋白/尿肌酐、高血压、高血脂、FPG、2hPG、HbA1c间比较,差异均无统计学意义(P>0.05)。

    两组患者家庭月收入、体质指数(BMI)间比较,差异均有统计学意义(P<0.05)。

    部分检验结果如下:

    475e1dbb354a2b4d799e327476b87114.png

    5bc7918713cf836f3a57f4221d206898.png

    ca3b2b31ea5e830621d02f3a408cd196.png

    (3)糖尿病前期患者焦虑和相关变量的相关性分析

    糖尿病前期患者是否焦虑与家庭月收入呈负相关(P<0.05),与性别、年龄、BMI、吸烟、饮酒、糖尿病家族史、文化程度、医疗保险类型、FPG、2hPG、HbA1c、高血压、高血脂、颈动脉硬化、下肢动脉硬化情况无直线相关关系(P>0.05)。

    e034693886489afac8d195fe1109e68c.png

    (4)糖尿病前期患者焦虑影响因素的多因素Logistic回归分析

    以是否焦虑为因变量(赋值:有=1,无=2),以年龄、家庭月收入(赋值:≦500=1,501~1000=2,1001~2000=3,2001~3000=4,3001~4000=5,4001~5000=6,≧5000=7)、FPG、2hPG、HbA1c为自变量进行多因素Logistic回归分析,结果显示,家庭月收入是糖尿病前期患者焦虑的影响因素。

    ae547eca8e11eeb7cd3680bea83a687a.png

    1b8db5129872cdc037b1e8b57519002a.png 结论

    糖尿病前期患者普遍存在焦虑情绪,家庭月收入是影响其情绪的主要因素,收入越高产生焦虑情绪的可能性越低。

    参考文献

    陈志雄,曾爱林,胡雅琴,刘精东.糖尿病前期患者焦虑现状调查及影响因素分析[J/OL].中国全科医学:1-5[2019-03-19].http://kns.cnki.net/kcms/detail/13.1222.R.20190309.1802.002.html.

    主要内容来源于《中国全科医学》杂志的《糖尿病前期患者焦虑现状及影响因素分析》,仅供学习交流,版权归原作者所有,如有侵权,请联系删除,谢谢!

    b2c7dbd86d50cfca77ab0ef6e103cac4.png

    学堂君的历史合辑:

    菜鸟系列

    问卷系列

    线性回归

    信效度分析

    聚类分析

    时间序列

    常见问题

    神经网络

    多维尺度分析

    C4.5算法

    生存分析

    对应分析

    欢迎添加:

    【数据分析服务】微信号:LYJ_312

     【社群服务助手】微信号:spss_shequn

     【加入团队】:请点击招募,我们是认真的!

    ed5470606dfc87a650a6dea44baf61c9.gif

    展开全文
  • 深入解读Logistic回归结果(一):回归系数,OR关键词:Logistic回归分析、lasso回归系数解读、回归系数解读Logistic回归虽然名字叫”回归”,但却是一种分类学习方法。使用场景大概有两个:第一用来预测,第二寻找因...
  • 有序分类的Logistic回归原理是将因变量的个分类依次分割为个二元的Logistic回归,例如本例中因变量“本国的税收过高”的赞同程度有4个等级,分析时拆分为三个二元Logistic回归,分别为(0 vs 1+2+3) 、(0+1 vs...
  • 回归分析是研究变量之间定量关系的一种统计学方法,具有广泛的应用。Logistic回归模型线性回归先从线性回归模型开始,线性回归是最基本的回归模型,它使用线性函数描述两个变量之间的...Logistic回归logistic回归(L...
  • 点击上方蓝字关注我们在社会科学的研究中,经常会遇到二元变量的情况,...如果希望根据一系列预测变量的值来预测某种特征或结果是否存在,且因变量为二元变量,通常采用二元Logistic回归。1二元逻辑回归分析的原理与...
  • logistic回归模型是一种线性生成模型。本文将介绍logistic回归模型相关的知识,为了更好地理解模型的决策边界函数,本文同时分析了多元变量的协方差对概率分布的影响。本文脉络:logistic回归模型的含义logistic模型...
  • Logistic回归结果的回归系数和OR值解读。Logistic回归虽然名字叫”回归”,但却是一种分类学习方法。使用场景大概有两个:第一用来预测,第二寻找因变量的影响因素。一 从线性回归到Logistic回归线性回归和Logistic...
  • SPSS实例教程:有序分类Logistic回归

    万次阅读 多人点赞 2017-10-29 22:38:21
    SPSS实例教程:有序分类Logistic回归 医小咖 10 个月前 1、问题与数据 在某胃癌筛查项目中,研究者想了解首诊胃癌分期(Stage)与患者的经济水平的关系,以确定胃癌筛查的重点人群。为了避免性别因素对结论的...
  • 二元Logistic回归

    千次阅读 2020-10-16 22:58:08
    研究分类反应变量与因素之间的关系,使用Logistic回归 典型例子:疾病的病因 (危险因素)分析 按反应变量分类 二分类:二元Logistic回归 分类无序:多元Logistic回归 分类有序:定序回归 (ordinal ...
  • 机器学习之Logistic回归解析及实例应用 22/100 viviliving <没有设置> from numpy import * import matplotlib.pyplot as plt from matplotlib.font_manager import FontProperties def loadDataSet(): ...
  • 如果我们采用因素对0-1表示的某种现象进行因果关系解释,就可能应用到logistic回归Logistic回归分为二值logistic回归logistic回归两类。首先用实例讲述二值logistic回归,然后进一步说明logistic...
  • 临度简单讲解了基础统计的知识,如:两组定量资料的分析思路之t检验组样本比较之方差分析 列联表之卡方检验之后介绍了logistic回归,如:统计分析之logistic回归单因素logistic回归分析案例多因素logistic回归案例...
  • 0.05),可采用无序分类的logistic回归进行分析。当然当结局变量无序,自变量只有一个且为分类变量时,可以直接采用卡方检验;结局变量有序,自变量只有一个且为分类变量时,可以直接采用非参数检验。 无序分类...
  • Logistic回归 分类算法 python实现 第一章 Python 机器学习入门之Logistic回归 分类算法 文章目录Logistic回归 分类算法 python实现前言一、Logistic回归是什么?二、Python实现1.引入库2.读入数据实验结果 前言...
  • 样本量的估计可能是临床最头疼的一件事了,其实很的临床研究事前是从来不考虑样本量的,至少我接触的临床研究大都如此。他们大都是想到就开始做,但是事后他们会寻求研究中样本量的依据,尤其是在投文章被审稿人...
  • logistic回归

    2018-05-27 00:04:51
    logistic回归又称logistic回归分析,是一种广义的线性...然后通过logistic回归分析,可以得到自变量的权重,从而可以大致了解到底哪些因素是胃癌的危险因素。同时根据该权值可以根据危险因素预测一个人患癌症的可能性。
  • 使用logistic回归时,偶尔会出现以下问题 > a=glm(X1~.,w,family=binomial(link='logit')) Warning messages: 1: glm.fit:算法没有聚合 2: glm.fit:拟合機率算出来是数值零或一 警告1 算法不收敛,可以通过...
  • 如何用GraphPad Prism9做logistic回归

    千次阅读 2020-11-29 03:40:02
    先来看看数据,很明显,第一列为因变量,其余为自变量,其中age为定量变量,sex为二分类,ticket class为分类。 之后,按照下图进行操作,选择new analysis——multiple variable analysis——multiple ...
  • 交叉表单因素分析 对频数进行加权:data-weight cases(数据-加权个案) 卡方检验:Analyze→Descriptive Statistics→Crosstabs,添加Row、Column,点击Statistics,选择Chi-square-Continue
  • 结合实际情况,可以将Logistic回归分析分为3类,分别是二元Logistic回归分析、多元有序Logistic回归分析和多元无序Logistic回归分析,如下图。Logistic回归分析用于研究X对Y的影响,并且对X的数据类型没有要求,X...
  • 一般来说,两组或组样本在比较检验时如果项指标有显著差异,我们下一步通常会探讨引起组别产生质的差别的影响因素,即自变量对因变量的影响是否具有统计学意义。今天我们就来梳理一下SPSS作logistic回归分析。在...
  • R实现分类logistic回归

    千次阅读 2021-01-14 02:10:11
    然后建立二元logistic回归方程,可以得到影响因素的OR值。那么如果遇到分类变量,如何进行logistic回归呢?譬如临床疗效分为好,中,差,三类,或者根据指标进行分类,分为高,中,低三类,我用1、2、3代表作为...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 7,517
精华内容 3,006
关键字:

多因素logistic回归