精华内容
下载资源
问答
  • 二项回归属于广义线性回归(GLM)的分支,与...负二项回归家族庞大,逐渐应用于社会科学领域各个学科的统计分析建模之中,本书详细介绍了负二项回归分析的原理以及该模型的多种变体,为该方法的学习提供了重要指导。
  • 如何进行负二项回归分析?

    千次阅读 2020-10-23 17:59:40
    此时使用负二项回归更为科学。 比如研究传染病人数,传染病人数明显具有一些空间聚焦现象;以及专利数量,很可能企业之间存在着某种空间意义上的竞争,导致数据具有聚焦现象,诸如此类数据其并不满足Poisson分布...

    如果研究X对于Y的影响,Y是计数资料,一般可以使用Poisson回归进行研究。但是Poisson回归要求数据满足等离散现象(平均值与方差相等),如果说数据具有一定的聚焦性,此时很可能就会产生过离散现象,即数据平均值与方差明显不相等。此时使用负二项回归更为科学。

     

    比如研究传染病人数,传染病人数明显具有一些空间聚焦现象;以及专利数量,很可能企业之间存在着某种空间意义上的竞争,导致数据具有聚焦现象,诸如此类数据其并不满足Poisson分布的独立性原则。此类数据通常情况下方差会明显的大于平均值,属于过离散数据,此种数据在进行Poisson回归时会导致模型参数估计值的标准误偏小

    因而,如果计数资料不适合Poisson分布时,尤其是数据过离散时,此时使用负二项回归分析更合适。

     

    1、案例背景

    当前有一项针对专利数量的影响关系研究,研究政府对于企业的支持力度,是否一线城市,对于企业专利数量的影响情况。共收集10个城市的数据,如下:

    X1是否一线城市:数字1表示为一线城市,数字0表示非一线城市
    X2政府扶持力度:数字越大表示对于企业申请专利时的扶持力度越大
    Y专利数量:数字表示某城市调研所有企业申请成功的专利数量
    Weight企业数量:数字表示某城市调研的企业数量

     

    2、理论

    关于过离散的检验有很多检验方法,在SPSSAU系统中可有三种方式进行综合判断,分别如下:

    • 如果说描述分析时发现平均值与方差值有着较大的差异,则说明负二项回归较合理,如果说平均值与方差值基本相等,说明可能使用Poisson回归较为合适。
    • 过离散现象可通过O检验(在Poisson回归分析时SPSSAU默认有提供)
    • 过离散现象的检验可针对alpha值进行检验,在负二项回归时默认输出,如果alpha值显著不为0(对应的P值小于0.05),则说明使用负二项回归较为合理,反之则说明可能使用Poisson回归较优。

     

    3、操作

    登录SPSSAU,选择【实验/医学研究】--【负二项回归】。

     

    本例子中专利数量是基于‘Weight企业数量’,因此‘基数Eposure【可选】’框中应该放入‘Weight企业数量’这项,如下图:

     

     

    4、SPSSAU结果分析

    (1)过度离散检验

     

    在进行负二项回归之前,专利数量的平均值是56.500,方差是2480.944,明显平均值与方差不相等,存在过离散现象。而且使用SPSSAU的Poisson回归时,对其提供的O检验发现,O值明显大于1.96(p=0.000 <0.05),拒绝等离散假定,说明数据存在明显的过离散现象,因此使用负二项回归较为适合。

     

    (2)负二项回归模型似然比检验

    SPSSAU共输出两个表格,分别是“负二项回归模型似然比检验”,“负二项回归分析结果汇总”。 “负二项回归模型似然比检验”是针对整个模型的检验,如果说模型p值小于0.05,意味着放入自变量更优,即模型有意义。“负二项回归分析结果汇总”是回归结果的具体结果。

     

     

    模型似然比检验用于对整体模型有效性进行分析。

    第一:首先对p值进行分析,如果该值小于0.05,则说明模型有效;反之则说明模型无效;

    第二:AIC值和BIC值可用于多次分析模型时的对比;此两个值越低越好;如果多次进行分析,对比该两个值的变化情况,综合说明模型构建的优化过程;

     

    首先对模型整体有效性进行分析,模型检验的原定假设为:是否放入自变量(X1是否一线城市, X2政府扶持力度)两种情况时模型质量均一样;检验p值为0.000小于0.05,因而说明拒绝原定假设,即说明本次构建模型时,放入的自变量具有有效性,本次模型构建有意义。

     

    (3)负二项回归分析结果汇总表

    从上表可知,将X1是否一线城市, X2政府扶持力度共2项为自变量,而将Y专利数量作为因变量进行负二项回归分析,从上表可以看出,模型公式为:Log(Y)=-10.316 + 0.213*X1是否一线城市 + 0.680*X2政府扶持力度 + ln(Weight企业数量)。模型的伪R方值(McFadden R 方)为0.196,说明研究模型可以解决专利数量19.6%的原因。具体分析可知:

     

    X1是否一线城市的回归系数值为0.213,但是并没有呈现出显著性(z=0.462,p=0.644>0.05),意味着X1是否一线城市并不会对Y专利数量产生影响关系,即城市类别与专利数量无明显关系。X2政府扶持力度的回归系数值为0.680,并且呈现出0.01水平的显著性(z=6.490,p=0.000 <0.01),意味着X2政府扶持力度会对Y专利数量产生显著的正向影响关系,以及优势比(OR值, exp(b)值)为1.973,意味着X2政府扶持力度增加一个单位时,Y专利数量的增加幅度为1.973倍。

     

    「更多内容登录SPSSAU官网了解」

    展开全文
  • 零膨胀负二项回归模型的使用 R语言

    千次阅读 2020-05-19 10:06:17
    近期,需要使用零膨胀负二项回归模型。因此,找到R语言中的一个包:pscl。 首先,使用Rstudio下载此包。 install.packages("pscl") 该软件发表于下面的期刊。 Zeileis A, Kleiber C, Jackman S. Regression models ...

    简介

    近期,需要使用零膨胀负二项回归模型。因此,找到R语言中的一个包:pscl。

    首先,使用Rstudio下载此包。

    install.packages("pscl")
    

    该软件发表于下面的期刊。

    Zeileis A, Kleiber C, Jackman S. Regression models for count data in R[J]. Journal of statistical software, 2008, 27(8): 1-25.

    详细使用可以参考:https://cran.r-project.org/web/packages/pscl/vignettes/countreg.pdf

    案例

    下面讲解一个自带的案例。

    library(pscl)
    data("bioChemists", package = "pscl") 
    
    fm_zinb <- zeroinfl(art ~ . | ., data = bioChemists, dist = "negbin") 
    

    在官方文档中提供了以下的一些方法用于查看模型的系数估计结果,预测,检验,AIC和BIC等。

    首先,我们summary一下:

    summary(fm_zinb)
    

    可以看到如下结果:
    在这里插入图片描述

    其次,我想看看AIC和BIC的结果。

    AIC(fm_zinb)
    BIC(fm_zinb)
    

    运行结果为:
    在这里插入图片描述

    展开全文
  • 二项逻辑回归到多逻辑回归

    千次阅读 2017-10-09 22:08:49
    逻辑回归是统计学中经典的分类算法,与...1.二项逻辑回归原理及其参数的求解如下: 2.多逻辑回归的原理 参考链接:http://www.cnblogs.com/yinheyi/p/6131262.html 参考链接:http://www.jianshu.com/

    逻辑回归是统计学中经典的分类算法,与最大熵一样都是对数线性模型。两者都是以似然函数为目标函数的最优化问题。通常通过迭代算法求解,比如上篇的梯度下降法。

    1.二项逻辑回归原理及其参数的求解如下:


    2.多项逻辑回归的原理


    参考链接:http://www.cnblogs.com/yinheyi/p/6131262.html

    参考链接:http://www.jianshu.com/p/8eb17fa41164

    展开全文
  • 本文转载多篇博客,综合了一下,组成了由基础到深入理解逻辑回归的博客。比较系统 1.回归的概念一:https://blog.csdn.net/alw_123/article/details/82193535 ...3.二项逻辑回归:https://blog.csdn.net...

    本文转载多篇博客,综合了一下,组成了由基础到深入理解逻辑回归的博客。比较系统

    1.回归的概念一:https://blog.csdn.net/alw_123/article/details/82193535

    2.回归的概念二:https://blog.csdn.net/alw_123/article/details/82825785

    3.二项逻辑回归:https://blog.csdn.net/pxhdky/article/details/82497304

    4.多项逻辑回归:https://blog.csdn.net/huangjx36/article/details/78056375

    5.模型参数估计:https://blog.csdn.net/pxhdky/article/details/83050712

    展开全文
  • 摘录:https://www.jianshu.com/p/af0a4f71c05a 考虑回归问题,可以采用boost方法 线性逼近 如果残差满足误差,退出 否则对于残差,次逼近 2次逼近 3)三次逼近 ...
  • 二项逻辑斯蒂回归的Python实现

    千次阅读 2019-01-09 23:05:01
    # 通过调用scipy.optimize.optimize求解逻辑斯蒂回归模型中的theta参数: import scipy.optimize as opt res = opt.minimize(fun=cost, x0=theta, args=(X, y), method='Newton-CG', jac=gradient) # theta参数存在...
  • 一、逻辑斯蒂分布/回归模型 模型描述的是一种什么样的事件或现象: 设X是连续随机变量,X服从逻辑斯蒂回归分布是指X具有下列分布函数和密度函数: 附上逻辑斯蒂分布的密度函数与分布函数,如下: 物理...
  • 关于二项逻辑斯谛回归的探讨

    千次阅读 2017-01-14 16:10:52
    关于二项逻辑斯谛回归和多逻辑斯谛回归的探讨,本文主要参考 MLaPP 第9章1. 指数家族在介绍逻辑斯谛回归模型之前,我们要先介绍一下指数家族。为什么要介绍指数家族呢? 在 MLaPP 9.2.6 中证明了,指数家族是最少...
  • 逻辑斯蒂回归二项和多

    千次阅读 2017-07-29 23:44:08
    逻辑斯蒂回归二项和多)1. 逻辑斯蒂分布定义 设X是连续随机变量,则X服从逻辑斯蒂分布,是指X具有下列分布函数和密度函数: F(x)=P(X)=11+e−(x−μ)/γ F(x) = P(X)=\dfrac{1}{1+e^{-(x-\mu)/\gamma}} f(x...
  • 一、 概述 Logistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,...因变量为分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。  下面学习一下Odds、OR、RR的概念: 在病例
  • 本文介绍回归模型的原理知识,包括线性回归、多项式回归和逻辑回归,并详细介绍Python Sklearn机器学习库的LinearRegression和LogisticRegression算法及回归分析实例。进入基础文章,希望对您有所帮助。
  • 1. 多逻辑斯蒂回归模型 多逻辑斯蒂回归模型(multi-...前面在逻辑斯蒂回归原理推导与求解中讲到的逻辑斯蒂回归模型是二项分类模型,用于分类。将其推广为多分类,假设离散型随机变量的取值集合是,那么多...
  • 2L ) val training = result( 0 ) //打印训练数据数目 print ( s"training Count: $ {training.count} " ) val test = result( 1 ) //打印测试数据数目 print ( s"test Count: $ {test.count} " ) /...
  • 《统计学习方法》李航著 P78 6.1.2节笔记 构造多逻辑斯蒂回归 转载于:https://www.cnblogs.com/learnMoreEveryday/p/8486383.html
  • 预测回归二:局部加权回归和惩罚线性回归 预测回归二:局部加权回归和惩罚线性回归 一、局部加权回归 原理 python 代码实现 、惩罚线性回归 2.1 岭回归 2.2 lasso 缩减法 2.3 ElasticNet 形式化 2.4 求解...
  • 这篇是接着我的前面的线性回归写的。之前说到为了抑制模型的复杂度,降低结构风险而在损失函数中引入了正则化。... 岭回归是在一般线性回归损失函数的基础上加入了L2正则化,控制了模型的复杂度。损失函
  • 一、回归问题的定义 回归是监督学习的一个重要问题,回归用于预测输入变量和输出变量之间的关系。回归模型是表示输入变量到输出变量之间映射的函数。回归问题的学习等价于函数拟合:使用一条函数曲线使其很好的拟合...
  • 手写算法-python代码实现Ridge(L2正则)回归

    千次阅读 热门讨论 2020-12-06 17:43:57
    手写算法-python代码实现Ridge回归Ridge简介Ridge回归分析与python代码实现1、标准方程法实现Ridge回归2、梯度下降法实现Ridge回归调用sklearn对比 Ridge简介 前面2篇文章,我们介绍了过拟合与正则化,比较全面的讲...
  • 回归

    千次阅读 2016-11-15 12:32:43
    什么是回归回归实际上就是“最佳拟合”。  根据已有的数据拟合出一条最佳的直线、曲线、超平面或函数等,用于预测其它数据的目标值。如已知一系列的点(x,y),我们可能就可以拟合出一条最佳的直线y=kx+b。那么...
  • 1.逻辑回归与多逻辑回归1.1什么是逻辑回归?逻辑回归,可以说是在线性回归的基础上加上一个sigmoid函数,将线性回归产生的值归一化到[0-1]区间内。sigmoid函数如下:​ sigmoid(x)=11+e−xsigmoid(x)=\frac{1}{1+e...
  • 线性回归误差分析

    千次阅读 2017-11-25 15:16:00
    线性回归误差分析在上一篇中,对线性回归算法有了一个简单的了解。博客地址为http://blog.csdn.net/qq_35028612/article/details/78628622。既然是拟合预测,真实值与预测值之间肯定是有差异的。(用ε\varepsilon...
  • 回归问题-Lasso回归

    万次阅读 多人点赞 2019-07-21 23:44:33
    Lasso(Least absolute shrinkage and ...它通过构造一个惩罚函数,可以将变量的系数进行压缩并使某些回归系数变为0,进而达到变量选择的目的。 正则化 正则化(Regularizaiton)是一种防止过拟合的方法。 ...
  • 手写算法-python代码实现逻辑回归逻辑回归原理解析损失函数定义以及数学公式推导过程解释1:通俗易懂的手推损失函数:解释2:最大似然估计求解参数对损失函数推导梯度python代码实现逻辑回归 逻辑回归原理解析 前面...
  • 作者:离散梦 欢迎大家给出宝贵的建议!...岭回归就是引入L2正则化 lasso回归就是引入L1正则化 ElasticNet回归就是引入L1和L2正则化(lasso和ridge回归组合)。 公式:   岭回归器就是用普通...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 109,218
精华内容 43,687
关键字:

二项回归