精华内容
下载资源
问答
  • 本文详细介绍了Stan中的稀疏精确条件回归(CAR)模型,作为对Stan中近似稀疏CAR模型先前工作的扩展。 稀疏表示似乎可以提高效率的数量级,对于大型空间数据集,可以更好地缩放。 具有空间随机效应的CAR先验 条件自...
  • 基于上海市外环以内263个交通分析小区的事故、道路、交通、土地利用数据,在交通分析小区层面建立贝叶斯负二项条件回归模型分析事故在交通分析小区层面的显著影响因素。结果表明,主、次干道长度的增加会显著...
  • 广义自回归条件异方差模型(GARCH)在我国股票市场中的实证研究,李泽光,曾剑秋,国家政策的推出对于股市的波动造成何种影响,是在研究我国股市波动性时需要关注的一个重要问题。本文即结合我国股票市场的实际发
  • 这个包提供了估计动态条件分数 [DCS] 类模型的功能,由 Harvey & Chakravarty (2008, 2009) 和 Creal, Koopman & Lucas (2013) 提出,同时独立地作为广义自回归分数 [GAS]楷模。 Harvey (2013) 对这些模型的理论进行...
  • 这个均值本质上是条件均值(给定父辈和种群平均身高,子代身高的均值),经典回归模型事实上就是在估计条件均值。 在经典回归模型中,我们希望用解释变量(regressand)XXX的函数g(X)g(X)g(X)来预测被解释变量(regressor...
  • 回归分析的假设条件

    千次阅读 2020-06-14 17:17:41
    数据什么样就能扔进回归分析回归分析
    展开全文
  • 我们需要进行以下六个假设,这些假设是经典的多元线性回归模型有效的前提: 1、因变量Y和自变量X1,X2,…,Xk之间的关系是线性的。 2、自变量(X1,X2,…,Xk)不是随机的。而且,两个或多个自变量之间不存在精确...
  • 引入RFR(random forest regression,随机森林回归)算法,分析气象条件、大气污染物浓度和季节所包含的22项特征因素,通过调整参数的最优组合,设计出一种新的PM2.5浓度预测模型——RFRP模型。同时,收集了西安市...
  • 本文脉络:logistic回归模型的含义logistic模型的决策边界函数分析logistic模型的参数最优化logistic回归模型与感知机模型的比较总结logistic回归模型的含义我们把分类模型分成两个阶段,推断阶段和决策...

    37d470dacc9b1c4161dad4418a117780.png

    logistic回归模型是一种线性生成模型。本文将介绍logistic回归模型相关的知识,为了更好地理解模型的决策边界函数,本文同时分析了多元变量的协方差对概率分布的影响。

    本文脉络:

    1. logistic回归模型的含义
    2. logistic模型的决策边界函数分析
    3. logistic模型的参数最优化
    4. logistic回归模型与感知机模型的比较
    5. 总结

    logistic回归模型的含义

    我们把分类模型分成两个阶段,推断阶段和决策阶段,推断阶段对联合概率分布建模,然后归一化,得到后验概率。决策阶段确定每个新输入x的类别。

    我们用推断阶段的方法来推导logistic回归模型,首先对类条件概率密度

    和类先验概率分布
    建模,然后通过贝叶斯定理计算后验概率密度。

    考虑二分类的情形,类别C1的后验概率密度;


    则:

    式中的

    就是logistic函数

    因此,logistic回归的值等于输入变量为x的条件下类别为C1的概率

    (1) 当

    分类结果为C1

    (2) 当
    分类结果为C2

    结论:logistic回归值表示所属类的后验概率,无论是二分类还是多分类,分类结果都是后验概率最大所对应的类。

    logistic的决策边界函数分析

    决策边界函数,简而言之,就是函数的两侧是不同的分类结果。

    可定性的分析协方差的三种情况与分布图的关系。

    (a) 图表示正常的协方差矩阵的高斯分布图。
    (b) 图表示协方差矩阵是对角矩阵的高斯分布图。
    (c) 图表示协方差矩阵是对角矩阵且对角元素都相等的高斯分布图。

    ed6eafab10f80176f8821fb8076e367c.png

    ab1d58cb1ff3744093ba4de9798d0cb6.png

    dd7c9ae7fadefc9958a8a7068a70aac3.png

    logistic的决策边界函数分析

    logistic曲线如下图,红色直线(a=0)表示决策边界函数:

    3c229a4600adc57ce68e388acec8d2e0.png

    假设类条件概率密度是高斯分布,即P(x|Ck),然后求解后验概率的表达式,即P(Ck|x)。我们知道,logistic回归值就是所求的后验概率。

    假设类条件概率密度的协方差相同,类条件概率密度为:

    由上面的推导公式得后验概率为:

    其中:

    由后验概率

    的表达式可知,当类条件的协方差矩阵相等时,决策边界函数是随x线性变化的直线。

    结论:如下图,若两类的条件概率密度的协方差相同时(如C1和C2的协方差相同),则决策边界函数是直线;若两类的条件概率密度的协方差不相同时(如C1和C3,C2和C3),则决策边界函数是曲线。判断协方差矩阵是否相同可以根据分布图形形状是否相同来判断,如C1和C2的协方差相同,C3和C1、C2的协方差不相同。

    963e5ca4fc546a105f3bd43d36796309.png

    假设类条件概率密度符合高斯分布且具有相同的协方差矩阵,则决策边界函数是一条直线;若类条件概率密度符合更一般的指数分布且缩放参数s相同,决策边界函数仍然是一条直线。

    logistic模型的参数最优化

    logistic模型损失函数

    logistic回归模型的含义是后验概率分布,因此可以从概率的角度去设计损失函数。

    考虑两分类情况,假设有N个训练样本,logistic模型是

    表示后验概率y=1的概率,则
    表示y=0的概率,变量
    取值1或0,且分别代表模型

    因此,似然函数

    损失函数

    logistic模型的参数最优化

    损失函数最小化等价于模型参数的最优化,如下图:

    利用梯度下降法求最优解,学习速率

    :

    具体求法本文不介绍,只给出算法的思想。
    为了避免过拟合问题,则在原来的损失函数增加正则项,然后利用梯度下降法求最优解,这里也不展开。

    logistic模型与感知机模型的比较

    logistic模型与感知机模型的相同点

    由上面的分析可知,假设类条件概率分布的协方差相同,则logistic模型的决策边界函数是随x线性变化的直线,因此,感知机模型与logistic模型的分类策略一样,即决策边界函数是一样的。如下图:

    d5bb1a5241499612c354f3d7371a1c6e.png

    感知机模型:当点落在直线上方,y>0,则分类结果为C1;反之为C2。
    logistic模型:当点落在上方,y>0,则后验概率P(C1|X)>0.5,分类结果为C1;反之为C2。

    考虑到对输入变量x进行非线性变换

    ,感知机和logistic模型的分类策略仍一样,决策边界函数相同,如下图:

    dba974f00771b1e18ae4ed733eed75aa.png

    感知机模型:当点落在圆外,y>0,则分类结果为C1;反之为C2。
    logistic模型:当点落在圆外,y>0,则后验概率P(C1|X)>0.5,分类结果为C1;反之为C2。

    logistic模型与感知机模型的异同点

    (1) logistic回归模型限制值的范围在0~1,感知机模型对值范围没有限制,因此logistic模型相比感知机模型,对异常点有更强的鲁棒性。如下图,当有异常数据时,logistic模型要好于感知机模型。

    b4fa6f11b6965ac6a678625e5dc4a05d.png

    (2) 感知机模型用误分类点到超平面的距离衡量损失函数,而logistic模型则从概率角度去衡量损失函数。

    总结

    logistic回归的含义是后验概率分布,用概率的角度去设计似然函数,logistic模型相比于感知机模型对异常数据具有更好的鲁棒性。

    展开全文
  • logistic回归模型分析

    千次阅读 2021-01-27 06:46:59
    本文脉络:logistic回归模型的含义logistic模型的决策边界函数分析logistic模型的参数最优化logistic回归模型与感知机模型的比较总结logistic回归模型的含义我们把分类模型分成两个阶段,推断阶段和决策...

    logistic回归模型是一种线性生成模型。本文将介绍logistic回归模型相关的知识,为了更好地理解模型的决策边界函数,本文同时分析了多元变量的协方差对概率分布的影响。

    本文脉络:logistic回归模型的含义

    logistic模型的决策边界函数分析

    logistic模型的参数最优化

    logistic回归模型与感知机模型的比较

    总结

    logistic回归模型的含义

    我们把分类模型分成两个阶段,推断阶段和决策阶段,推断阶段对联合概率分布建模,然后归一化,得到后验概率。决策阶段确定每个新输入x的类别。

    我们用推断阶段的方法来推导logistic回归模型,首先对类条件概率密度

    equation?tex=p%28%5Coverrightarrow%7Bx%7D%7CC_%7Bk%7D%29 和类先验概率分布

    equation?tex=p%28C_%7Bk%7D%29 建模,然后通过贝叶斯定理计算后验概率密度。

    考虑二分类的情形,类别C1的后验概率密度;

    equation?tex=P%28C1%7C%5Coverrightarrow%7Bx%7D%29+%3D+%5Cfrac%7BP%28%5Coverrightarrow%7Bx%7D%7CC1%29P%28C1%29%7D%7BP%28%5Coverrightarrow%7Bx%7D%29%7D

    equation?tex=P%28C1%7C%5Coverrightarrow%7Bx%7D%29+%3D+%5Cfrac%7BP%28%5Coverrightarrow%7Bx%7D%7CC1%29P%28C1%29%7D%7BP%28%5Coverrightarrow%7Bx%7D%7CC1%29P%28C1%29%2BP%28%5Coverrightarrow%7Bx%7D%7CC2%29P%28C2%29%7D

    equation?tex=P%28C1%7C%5Coverrightarrow%7Bx%7D%29+%3D+%5Cfrac%7B1%7D%7B1%2B%5Cfrac%7BP%28%5Coverrightarrow%7Bx%7D%7CC2%29P%28C2%29%7D+%7BP%28%5Coverrightarrow%7Bx%7D%7CC1%29P%28C1%29%7D+%7D

    equation?tex=ln%5Cfrac%7BP%28%5Coverrightarrow%7Bx%7D%7CC1%29P%28C1%29%7D%7BP%28%5Coverrightarrow%7Bx%7D%7CC2%29P%28C2%29%7D+%3D+%5Calpha

    则:

    equation?tex=P%28C1%7C%5Coverrightarrow%7Bx%7D%29+%3D+%5Cfrac%7B1%7D%7B1%2Be%5E%7B-%5Calpha%7D%7D+%3D+%5Csigma%28%5Calpha%29

    式中的

    equation?tex=%5Csigma%28%5Calpha%29 就是logistic函数

    因此,logistic回归的值等于输入变量为x的条件下类别为C1的概率

    equation?tex=P%28C1%7C%5Coverrightarrow%7Bx%7D%29

    equation?tex=%5Csigma%28%5Calpha%29+%3D+%5Cfrac%7B1%7D%7B1%2Be%5E%7B-a%7D%7D

    equation?tex=%5Calpha+%3D+ln%5Cfrac%7BP%28%5Coverrightarrow%7Bx%7D%7CC1%29P%28C1%29%7D%7BP%28%5Coverrightarrow%7Bx%7D%7CC2%29P%28C2%29%7D

    equation?tex=a+%3D+ln%5Cfrac%7BP%28%5Coverrightarrow%7Bx%7D%2CC1%29%7D%7BP%28%5Coverrightarrow%7Bx%7D%2CC2%29%7D

    (1) 当

    equation?tex=a+%5Cge+0%E6%97%B6%2CP%28%5Coverrightarrow%7Bx%7D%2CC1%29+%5Cge+P%28%5Coverrightarrow%7Bx%7D%2CC2%29%2CP%28C1%7C%5Coverrightarrow%7Bx%7D%29%5Cge+%5Cfrac%7B1%7D%7B2%7D 分类结果为C1

    (2) 当

    equation?tex=a+%3C+0+%E6%97%B6%2CP%28%5Coverrightarrow%7Bx%7D%2CC1%29+%3C+P%28%5Coverrightarrow%7Bx%7D%2CC2%29%2CP%28C1%7C%5Coverrightarrow%7Bx%7D%29%3C%5Cfrac%7B1%7D%7B2%7D 分类结果为C2

    结论:logistic回归值表示所属类的后验概率,无论是二分类还是多分类,分类结果都是后验概率最大所对应的类。

    logistic的决策边界函数分析

    决策边界函数,简而言之,就是函数的两侧是不同的分类结果。

    可定性的分析协方差的三种情况与分布图的关系。

    (a) 图表示正常的协方差矩阵的高斯分布图。

    (b) 图表示协方差矩阵是对角矩阵的高斯分布图。

    (c) 图表示协方差矩阵是对角矩阵且对角元素都相等的高斯分布图。

    logistic的决策边界函数分析

    logistic曲线如下图,红色直线(a=0)表示决策边界函数:

    假设类条件概率密度是高斯分布,即P(x|Ck),然后求解后验概率的表达式,即P(Ck|x)。我们知道,logistic回归值就是所求的后验概率。

    假设类条件概率密度的协方差相同,类条件概率密度为:

    equation?tex=p%28x%7CC_%7Bk%7D%29+%3D+%5Cfrac%7B1%7D%7B%282+%5CPi%29%5E%7B%5Cfrac%7BD%7D%7B2%7D%7D%7D+%5Cfrac%7B1%7D%7B%7C%5Csum%7C%5E%7B%5Cfrac%7B1%7D%7B2%7D%7D%7D+exp%7B+-%5Cfrac%7B1%7D%7B2%7D%28x+-+%5Cmu_%7Bk%7D%29%5E%7BT%7D+%5Csum%5E%7B-1%7D%7D+%28x-%5Cmu_%7Bk%7D%29

    由上面的推导公式得后验概率为:

    equation?tex=P%28C_%7Bk%7D%7Cx%29+%3D+%5Csigma%28w_%7Bk%7D%5E%7BT%7Dx+%2B+w_%7Bk0%7D%29

    其中:

    equation?tex=w_%7Bk%7D+%3D+%5Csum%5E%7B-1%7D+%5Cmu_%7Bk%7D

    equation?tex=w_%7Bk0%7D+%3D+-%5Cfrac%7B1%7D%7B2%7D%5Cmu_%7Bk%7D%5E%7BT%7D%5Csum%5E%7B-1%7D%5Cmu_%7Bk%7D+%2B+ln+p%28C_%7Bk%7D%29

    由后验概率

    equation?tex=%28P%28C_%7Bk%7D%7Cx%29%29 的表达式可知,当类条件的协方差矩阵相等时,决策边界函数是随x线性变化的直线。

    结论:如下图,若两类的条件概率密度的协方差相同时(如C1和C2的协方差相同),则决策边界函数是直线;若两类的条件概率密度的协方差不相同时(如C1和C3,C2和C3),则决策边界函数是曲线。判断协方差矩阵是否相同可以根据分布图形形状是否相同来判断,如C1和C2的协方差相同,C3和C1、C2的协方差不相同。

    假设类条件概率密度符合高斯分布且具有相同的协方差矩阵,则决策边界函数是一条直线;若类条件概率密度符合更一般的指数分布且缩放参数s相同,决策边界函数仍然是一条直线。

    logistic模型的参数最优化

    logistic模型损失函数

    logistic回归模型的含义是后验概率分布,因此可以从概率的角度去设计损失函数。

    考虑两分类情况,假设有N个训练样本,logistic模型是

    equation?tex=h_%7B%5Ctheta%7D%28x%29%EF%BC%8Ch_%7B%5Ctheta%7D%28x%29 表示后验概率y=1的概率,则

    equation?tex=1-h_%7B%5Ctheta%7D%28x%29 表示y=0的概率,变量

    equation?tex=y_%7Bi%7D 取值1或0,且分别代表模型

    equation?tex=h_%7B%5Ctheta%7D%28x%29%E5%92%8C1-h_%7B%5Ctheta%7D%28x%29

    因此,似然函数

    equation?tex=L%28%5Ctheta%29%3A

    equation?tex=L%28%5Ctheta%29+%3D+%5Cprod_%7Bi%3D1%7D%5E%7BN%7D%28h_%7B%5Ctheta%7D%28x%29%5E%7By_%7Bi%7D%7D%29%281-h_%7B%5Ctheta%7D%28x%29%5E%7By_%7Bi%7D%7D%29

    损失函数

    equation?tex=J%28%5Ctheta%29%EF%BC%9A

    equation?tex=J%28%5Ctheta%29+%3D+-L%28%5Ctheta%29

    equation?tex=J%28%5Ctheta%29+%3D+-%5Cprod_%7Bi%3D1%7D%5E%7BN%7D%28h_%7B%5Ctheta%7D%28x%29%5E%7By_%7Bi%7D%7D%29%281-h_%7B%5Ctheta%7D%28x%29%5E%7By_%7Bi%7D%7D%29

    logistic模型的参数最优化

    损失函数最小化等价于模型参数的最优化,如下图:

    equation?tex=J%28%5Ctheta%29+%3D+-%5Cprod_%7Bi%3D1%7D%5E%7BN%7D%28h_%7B%5Ctheta%7D%28x%29%5E%7By_%7Bi%7D%7D%29%281-h_%7B%5Ctheta%7D%28x%29%5E%7By_%7Bi%7D%7D%29

    equation?tex=%28J%28%5Ctheta%29%29min+%3D+ln+%28J%28%5Ctheta%29%29min

    equation?tex=ln+%28J%28%5Ctheta%29%29+%3D+-%5Cprod_%7Bi%3D1%7D%5E%7BN%7D+%28y_%7Bi%7Dln+%28h_%7B%5Ctheta%7D%28x%29%29+%2B+%281-y_%7Bi%7D%29ln+%281-h_%7B%5Ctheta%7D%28x%29%29%29

    利用梯度下降法求最优解,学习速率

    equation?tex=%5Calpha+ :

    equation?tex=%5Ctheta+%3D+%5Ctheta+-+%5Calpha+%5Cfrac%7B%5Cpartial%7BJ%28%5Ctheta%29%7D%7D%7B%5Cpartial%7B%5Ctheta%7D%7D

    具体求法本文不介绍,只给出算法的思想。

    为了避免过拟合问题,则在原来的损失函数增加正则项,然后利用梯度下降法求最优解,这里也不展开。

    logistic模型与感知机模型的比较

    logistic模型与感知机模型的相同点

    由上面的分析可知,假设类条件概率分布的协方差相同,则logistic模型的决策边界函数是随x线性变化的直线,因此,感知机模型与logistic模型的分类策略一样,即决策边界函数是一样的。如下图:

    感知机模型:当点落在直线上方,y>0,则分类结果为C1;反之为C2。

    logistic模型:当点落在上方,y>0,则后验概率P(C1|X)>0.5,分类结果为C1;反之为C2。

    考虑到对输入变量x进行非线性变换

    equation?tex=%5Ctheta%28x%29 ,感知机和logistic模型的分类策略仍一样,决策边界函数相同,如下图:

    感知机模型:当点落在圆外,y>0,则分类结果为C1;反之为C2。

    logistic模型:当点落在圆外,y>0,则后验概率P(C1|X)>0.5,分类结果为C1;反之为C2。

    logistic模型与感知机模型的异同点

    (1) logistic回归模型限制值的范围在0~1,感知机模型对值范围没有限制,因此logistic模型相比感知机模型,对异常点有更强的鲁棒性。如下图,当有异常数据时,logistic模型要好于感知机模型。

    (2) 感知机模型用误分类点到超平面的距离衡量损失函数,而logistic模型则从概率角度去衡量损失函数。

    总结

    logistic回归的含义是后验概率分布,用概率的角度去设计似然函数,logistic模型相比于感知机模型对异常数据具有更好的鲁棒性。

    展开全文
  • 在医学研究中,为了控制一些重要的混杂因素,经常会把病例和对照按年龄,性别等条件进行配对,...病历对照研究或者倾向得分匹配研究(一种将研究数据处理成‘随机对照实验数据’的方法)中常使用条件Logistic回归进...

    95605bce69ff7c0932288aa7e30e45aa.png

    在医学研究中,为了控制一些重要的混杂因素,经常会把病例和对照按年龄,性别等条件进行配对,形成多个匹配组。各匹配组的病例数和对照人数是任意的,比如一个病例和若干个对照匹配即1:1,在医学上称作“1:1病历对照研究”,常见还有1:M(M <=3),即1个病例和1或2或3个对照匹配。

    病历对照研究或者倾向得分匹配研究(一种将研究数据处理成‘随机对照实验数据’的方法)中常使用条件Logistic回归进行分析。其与普通的二元logistic回归区别在于,多出配对ID,即将配对组纳入考虑范畴。

    1、案例背景

    某北方城市研究喉癌发病的危险因素,使用1:2匹配的病例对照研究方法进行调查。共有25对配对数据(每对3个,即25*3=75行数据)。现研究两个影响因素分别是:是否吸烟和是否有癌症家族史。数据格式(部分)如下表:

    cda852773ba138311788c6ab37824ed9.png

    提示:

    条件logistic回归时,数据中一定需要记录配对编号,比如1:2的配对(1个病例配对2个对照,且共有20个组,组别编号从1到20,那么同时会有3个1,3个2,3个3,类似下去),而且在分析时将配对编号放入对应框中。

    配对编号ID:共有25对配对,编号从1~25,每个数字会重复3次(分别对应病例或对照组);

    Y是否患喉癌:数字1表示病例组即患喉癌,数字0表示对照组即没有患喉癌;

    X1是否吸烟:数字1表示吸烟,数字0表示不吸烟;

    X2癌症家族史:数字1表示有家族患喉癌史,数字0表示没有家族患喉癌史。

    在做条件logistic回归时,因变量只能为0和1二分类数据。数字中只能包括0和1,如果不是,可使用[数据处理]->[数据编码]进行设置。

    d29d3361a7887b5653819e33aa219273.png

    2、操作

    本例子操作截图如下:

    aba8d395277a9d4aaf83f2e1376d1174.png

    3、结果分析

    SPSSAU共输出三个表格,分别是:“条件logit回归模型似然比检验结果”,“条件logit回归模型分析结果汇总”,“条件logit回归模型分析结果汇总”。

    第一个表格:条件logit回归模型似然比检验结果

    模型似然比检验,用于分析模型是否有效;

    5feeb50011fd6a09b39da7c78dd6a8b4.png

    在分析上,首先需要模型通过似然比检验,其原定假设为不加入X和加入X模型无明显差异,如果对应的p值小于0.05,意味着拒绝原假设,也即说明模型有意义。

    从上表可知:此处模型检验的原定假设为:是否放入自变量(X1是否吸烟, X2癌症家族史)两种情况时模型质量均一样;从上表可知,模型拒绝原定假设(chi=6.319,p=0.042 <0.05),即说明本次构建模型时,放入的自变量具有有效性,本次模型构建有意义。

    第二个表格:条件logit回归模型分析结果汇总

    包括模型的回归系数,R方值等数据;

    5eb3cc48fca2c060e62d899d0fe563a0.png

    从上表可知:模型McFadden R方值为0.115,意味着是否吸烟, 癌症家族史共2项可解释是否患喉癌的11.5%原因。

    具体来看:X1是否吸烟的回归系数值为1.243,并且呈现出0.05水平的显著性(z=2.322,p=0.020 <0.05),意味着X1是否吸烟会对Y是否患喉癌产生显著的正向影响关系。以及 (RR值,exp(b)值)为3.465(95% CI:1.214~9.892),意味着相对不吸烟群体,吸烟群体患喉癌的风险倍数会加大3.465倍。

    X2癌症家族史的回归系数值为-0.184,但是并没有呈现出显著性(z=-0.365,p=0.715>0.05),意味着是否有癌症家族史并不会对患喉癌产生影响。

    4、总结

    分析过程涉及以下几个关键点:

    (1)条件logistic回归时,数据中一定需要记录下配对编号,比如1:2的配对(1个病例配对2个对照,且共有20个组,组别编号从1到20,那么同时会有3个1,3个2,3个3,类似下去),而且在分析时将配对编号放入对应框中。

    (2)条件logistic回归时,因变量只能为0和1二分类数据,数字中只能包括0和1,如果不是,可使用数据处理->数据编码进行设置。

    「更多内容登录SPSSAU官网了解」

    SPSSAU | 在线SPSS分析软件​spssau.com
    7977b7332d677c1a854b003e229310ec.png
    展开全文
  • 对于那些有创意的人,如果你觉得有必要使用上面这些参数的一个组合,你甚至可以创造出一个没有被使用过的回归模型。 但在你开始之前,先了解如下最常用的回归方法: 1. 线性回归(Linear Regression) 线性...
  • 其次,为了描述财务时间序列的高峰和肥尾以及杠杆效应,本文使用基于自回归综合移动平均模型的偏斜非对称幂自回归条件异方差模型分析销售数据。 实证分析表明,考虑偏态分布的模型是有效的。
  • 提出了齐次等式约束线性回归模型回归系数的一个新的有偏估计,即综合条件岭估计.讨论了综合条件岭估计的可容许性等优良性质.给出了其迭代解和极小化均方误差的无偏估计解.在一定的条件下,综合条件岭估计的样本总...
  • 各种回归模型适用条件,logistic回归.ppt
  • 一文读懂条件Logistic回归

    千次阅读 2021-03-03 16:47:22
    在医学研究中,为了控制一些重要的混杂因素,经常会把病例和对照按年龄,性别等条件进行配对,...病历对照研究或者倾向得分匹配研究(一种将研究数据处理成‘随机对照实验数据’的方法)中常使用条件Logistic回归进...
  • logistic回归模型

    万次阅读 多人点赞 2020-04-13 17:44:45
    logistic回归模型 从这一期开始,我们准备介绍一系列机器学习算法模型,主要包括logistic回归,决策树,随机森林,关联规则,朴素贝叶斯,支持向量机模型,隐式马尔可夫模型,因子分析,主成分分析,聚类,多元线性...
  • 21向量自回归模型

    千次阅读 2020-12-09 10:59:21
    向量自回归模型简称VAR模型,是一种常用的计量经济模型,1980年由克里斯托弗·西姆斯(Christopher Sims)提出。VAR模型是用模型中所有当期变量对所有变量的若干滞后变量进行回归。VAR模型用来估计联合内生变量的动态...
  • 为研究随机森林在分类与回归分析中的应用提供参考 ">随机森林 random forest 模型是由Breiman 和Cutler 在2001 年提出的一种基于分类树的算法 它通过 对大量分类树的汇总提高了模型的预测精度 是取代神经网络等传统...
  • 为了解决在估计条件回归极差模型(CARR)中的分布厚尾性问题,采用尾部呈幂函数衰减的对数正态分布估计CARR模型在新息序列具有有限的12阶矩条件下,利用M估计的大样本性质和鞅的泛函中心极限定理,允许模型包含一...
  • 数据分析--分类与回归模型(一)

    千次阅读 2019-08-25 17:56:30
    一、分类回归方法 主要的分类、回归算法,网上和...logistics回归模型步骤 根据挖掘目的设置特征,并筛选特征x1,x2...xp,使用sklearn中的feature_selection库,F检验来给出特征的F值和P值,筛选出F大的,p小的值...
  • 多元线性回归,主要是研究一个因变量与多个自变量之间的相关关系,跟一元回归原理差不多,区别在于影响因素(自变量)更多些而已,例如:一元线性回归方程 为:毫无疑问,多元线性回归方程应该为:上图中的 x1, x2, xp...
  • 基于滞后虚拟变量分位点回归模型条件VaR估计,裴培,贺壬癸,在大多数文献中,分位点回归模型是线性的,但是在实际中,线性的分位点回归模型已经不能很好地满足需要,为此本文提出了含有滞后
  • 线性回归的假定条件

    千次阅读 2020-12-20 12:10:44
    做线性回归之前需要做以下假定: (1)模型对参数而言是线性的( 只能是以1次方出现); (2)在重复抽样中X是固定的,或X是非随机的; (3)干扰项满足 Gauss-Markov条件 {E(εi)=0cov⁡(εi,εj)={σ2,i=j0,i≠j \...
  • 文章目录一、线性回归假设条件(LINE)二、 残差分析1....其方差 σ2\sigma^2σ2 = var ( ϵi\epsilon_iϵi​ ) 反映了回归模型的精度, σ2\sigma^2σ2 越小,用所得到回归模型预测y的精确度愈高 独
  • 回归分析标志着预测建模的第一步。毫无疑问,回归分析非常容易实现。无论是语法还是其中使用的参数,都没有任何易混淆的。但是,只跑一行代码是无法解决问题的,也不是只看看R² ,MSE值就可以的。回归分析告诉我们...
  • geobugs的一个分析案例,GeoBUGS 疾病制图法在条件回归模型中的应用 的PDF版本
  • 对非齐次等式约束线性回归模型提出一种有偏估计,即条件岭型估计,证明了在一定的条件下,在均方误差及均方误差矩阵意义下都优于回归系数的约束最小二乘估计,并给出了两次随机数据模拟的结果,模拟数据结果表明在...
  • 一、生存分析基本概念1、事件(Event)指研究中规定的生存研究的终点,在研究开始之前就已经制定好。根据研究性质的不同,事件可以是患者的死亡、疾病的复发、仪器的故障,也可以是下岗工人的再就业等等。2、生存时间...
  • 文章目录回归分析认识回归什么是回归Sklearn中的回归回归模型的应用线性模型(linear model)获得线性模型线性模型的基本形式线性回归目标函数(单变量)目标函数(多变量)python实现数据集划分:线性回归实例逻辑...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 98,580
精华内容 39,432
关键字:

动态回归模型的条件