精华内容
下载资源
问答
  • 多重比较校正的方法很多,如Bonferroni、False Discovery Rate(FDR)、Random-field Theory (RFT)等等,各种校正方法各有优劣,具体应用时要根据自己的统计分析的数据特点进行选择。本文,笔者对Bonferroni和False ...

    0.jpeg

    作者:kervin

    微信号:kervin_zhao

    在科学研究的统计分析中,我们往往会遇到多重比较校正问题。多重比较校正的方法很多,如Bonferroni、False Discovery Rate(FDR)、Random-field Theory (RFT)等等,各种校正方法各有优劣,具体应用时要根据自己的统计分析的数据特点进行选择。本文,笔者对Bonferroni和False Discovery Rate(FDR)两种校正方法进行论述,特别是对于应用比较广的FDR校正方法,笔者用具体的例子详细阐述了其原理,并给出其Matlab程序。

    为什么要进行多重比较校正

    当在同一个数据集上进行多次统计检验时,就需要进行多重比较校正。举个简单的例子,A、B两组被试,我们从每个被试身上得出10个指标。如果我们要研究A、B两组被试的某一个指标是否存在显着差异,那么此时我们只做一次统计分析就行;假设这个指标的p值小于0.05,我们会认为这个指标在A、B两组之间存在显着差异,此时,我们犯错的概率(或者称为假阳性率)是5%。假设我们把这10个指标都进行了统计分析,即使每个独立的指标的p值都小于0.05,此时我们犯错的概率不再是5%,而是1-(0.95)^10=0.4013,也就是说此时我们犯错的概率达到40%多,这在统计学上是不可接受的。因此,需要进行多重比较校正。

    Bonferroni 校正方法

    Bonferroni校正方法非常简单,若单次显着性水平为0.05,那么Bonferroni 校正后的p值应该为0.05/n,其中n为统计比较的次数。Bonferroni 校正方法应该属于最严格的一种校正方法,当统计比较的次数比较多时,Bonferroni 校正后的p值会非常小,此时不推荐使用这种校正方法。当统计比较的次数较小时,如小于几十个时,可以尝试使用。

    FDR 校正方法

    这里,笔者主要对FDR校正方法的原理进行论述。FDR校正方法是Benjamini和Hochberg于1995年提出了一种多重比较校正的方法。其实,FDR具体的算法也有多种,如Storey法(由Storey等人提出)、Benjamini-Hochberg法(简称BH法)等。其中BH法目前应用最广,这里主要介绍这种方法的基本原理。

    基于BH法的FDR校正过程:

    第一步:将我们单独统计得到的一系列的p=[p1,p2,…,pn]从大到小进行重新排序,计为P=[P1,P2,…,Pn];

    第二步:按照以下公式计算每个P值所对应的校正前的FDR值,这里称之为Q值:Q = Pi* (n/r),Pi表示P中元素值,n是P值个数,r依次为n,n-1,…,1。

    第三步:对Q进行校正,得到FDR值。对于计算出来的Q=[Q1,Q2,…,Qn],若某一个Qi值大于前一位Qi-1值,则把Qi的值赋值为Qi-1;反之则保留相应的Q值。最终得到Q值称之为校正后的FDR值。

    第四步:按照重排序之前的顺序返回各个p值对应的校正后的FDR值。

    例子:假设p=[0.01, 0.005, 0.03, 0.03, 0.02, 0.04, 0.05],计算相应的校正后的FDR值。

    笔者按照上述步骤,自行编制相应的Matlab程序,计算过程和结果如下:

    按照上述第一步步骤,计算得到P=[0.0500, 0.0400, 0.0300, 0.0300, 0.0200, 0.0100, 0.0050];

    按照第二步中的方法,计算得到Q=[0.0500, 0.0467, 0.0420, 0.0525, 0.0467, 0.0350, 0.0350];

    按照第三步:得到校正后的FDR值为:FDR=[ 0.0500, 0.0467, 0.0420, 0.0420, 0.0420, 0.0350, 0.0350];

    最后,转换成原来的顺序:FDR=[0.0350, 0.0350, 0.0420, 0.0420, 0.0420, 0.0467, 0.0500].

    对于本例来说,如果总体的显着性水平设置为0.05,那么从得到的最后的FDR值来说,这几个p值都具有显着性差异。

    总结

    本文,笔者对为什么要进行多重比较校正做了简单介绍,并重点论述了FDR多重比较校正方法。关于本文中FDR校正对应的Matlab程序,如有朋友需要,请先转发本文到您的朋友圈,然后截图发给我(微信号:kervin_zhao),我会把相应代码发给您(原创不易,请大家理解)。对于多重比较校正遇到的问题,也可以加笔者进行交流。如果各位朋友觉得本文对您有帮助,也烦请各位积极转发本文到您的朋友圈,并点击文末右下方的“在看”。

    原创不易,请各位朋友积极转发,多多支持,您的每一次转发就会给我们的创作增加一份动力,谢谢!推荐阅读

    如何计算EEG信号的香农熵Shannon entropy(附Matlab程序)

    聊一聊置换检验Permutation test的原理

    脑科学研究中常用的神经电信号记录电极介绍

    大脑中的结构连接、功能连接和有效连接

    基于图论的复杂脑网络分析中的常用指标

    关注我们

    展开全文
  • 简单介绍一下常用方法它们的含义,以及如何正确恰当选择使用这些方法。LSD:最小显著差异法,实际上是 t 检验的改进,检验统计量为T,在变异和自由度的计算上利用了整个样本信息,而不仅仅是比较两组的信息。它的...

    以SPSS为例,十多种方法可选,上图为英文视图,下图为中文翻译视图,请对照学习。

    简单介绍一下常用的方法它们的含义,以及如何正确恰当选择使用这些方法。

    LSD:最小显著差异法,实际上是 t 检验的改进,检验统计量为T,在变异和自由度的计算上利用了整个样本信息,而不仅仅是比较两组的信息。它的敏感度最高,在比较时仍然存在放大α水准(一类错误)的问题,换言之就是总的二类错误非常小,要是LSD法都没有检验出有差别,恐怕真的没差别了。

    检验原理与t检验相同,但比一般t检验的敏感性高,只要各组均值间存在一定程度的微小差异就有可能被检验出来。LSD法侧重于减小II类错误,但有增大I类错误的可能。

    Bonferroni:由 LSD 法修正而来,通过调整每个检验的α水准来控制总的α水准,最终保证总的α水准为0.05,该方法敏感度介于 LSD 法和 Scheffe 法之间。Bonferroni用途最广,几乎可用于任何多重比较的情形,包括组间例数相等或不等、成对两两比较或综合多重比较等。

    S-N-K:即 Student Newman Keuls 法,是应用最广泛的一种两两比较方法。它采用Student-Range 分布进行所有组均值间的配对比较。该方法保证在H0真正成立时总的α水准等于实际设定值,即控制了一类错误。

    检验后将没有显著差异的组别放在一个子集,有显著差异的组别分在不同子集,控制了犯I类错误的概率。

    TUKEY:即 Tukey

    展开全文
  • 原标题:多重比较法-LSD I 附赠统计学最全思维导图~文末附赠统计学最全干货导图~前面我们讲了方差分析,方差分析主要是用于多组均值比较的,方差分析的...多重比较方法有很多种,这篇主要介绍一下比较常用的一种LS...

    原标题:多重比较法-LSD I 附赠统计学最全思维导图~

    文末附赠统计学最全干货导图~

    前面我们讲了方差分析,方差分析主要是用于多组均值比较的,方差分析的结果是多组均值之间是否有显著性差异,但是这个显著性差异是整体的显著性差异,可是我们并不知道具体是哪些组之间有显著性差异。所以就有了我们今天的多重比较,目的就是为了获取具体哪些组之间有显著差异。

    多重比较法方法有很多种,这篇主要介绍一下比较常用的一种LSD,LSD是least significant difference的缩写,又称最小显著差异方法。

    使用LSD方法的具体步骤为:

    1.提出假设:H0:两组之间无差异;H1:两组之间有差异。

    2.计算检验统计量:两组均值之差的绝对值。

    3.计算LSD,公式为

    34a37d4f579bf65cc0be102ccfe8cbf1.png

    tα/2为t分布的临界值,通过查t分布表得到,其自由度为n-k,n为样本总数,k为因素中不同水平的水平个数;MSE为组内方差;ni和nj分别为第i个样本和j个样本的样本量。

    4.根据显著性水平α做作出决策,如果均值之差的绝对值大于LSD,则拒绝H0,否则不拒绝H0。

    step1:提出如下假设。

    假设1:H0:零售业与旅游业无差异;H1:零售业与旅游业有差异

    假设2:H0:零售业与航空业无差异;H1:零售业与航空业有差异

    假设3:H0:零售业与家电制造业无差异;H1:零售业与家电制造业有差异

    假设4:H0:旅游业与航空业无差异;H1:旅游业与航空业有差异

    假设5:H0:旅游业与家电制造业无差异;H1:旅游业与家电制造业有差异

    假设6:H0:航空业与家电制造业无差异;H1:航空业与家电制造业有差异

    step2:计算检验统计量,即各两组之间的均值之差的绝对值

    假设1、2、3、4、5、6分别对应的均值之差绝对值为1、14、10、13、11、24

    step3:根据LSD公式计算每个假设对应的LSD值。

    根据数据求取得到组内平方和MSE = 142.526,具体求取方法参考前面讲的方差分析;

    通过查t分布表,在α=0.05以及自由度=n-k=23-4=19情况下,tα/2=2.093;

    最后计算出不同假设对应的LSD值为13.90、14.63、14.63、15.13、15.13、15.80

    step4:作出决策

    假设1的均值之差绝对值1小于对应的LSD值13.90,所以不拒绝假设H0,即不能认为零售业与旅游业有显著差异

    假设2的均值之差绝对值14小于对应的LSD值14.63,所以不拒绝假设H0,即不能认为零售业与航空业有显著差异

    假设3的均值之差绝对值10小于对应的LSD值14.63,所以不拒绝假设H0,即不能认为零售业与家电制造业有显著差异

    假设4的均值之差绝对值13小于对应的LSD值15.13,所以不拒绝假设H0,即不能认为旅游业与航空业有显著差异

    假设5的均值之差绝对值11小于对应的LSD值15.13,所以不拒绝假设H0,即不能认为旅游业与家电制造业有显著差异

    假设6的均值之差绝对值24大于对应的LSD值15.80,所以拒绝假设H0,即认为航空业与家电制造业有显著差异

    以上就是关于多重比较法-LSD的一个简单介绍以及案例,希望对大家有用。

    作者:张俊红

    中国统计网后台回复【统计】

    即可领取全部导图源文件

    用一系列「思维导图」由浅入深的总结了「统计学」领域的基础知识,是对之前系列文章做的一次完整的梳理,也是我至今为止所有与统计有关的学习笔记。

    众所周知,「统计学」是深入理解「机器学习|数据挖掘」的重要基础学科。正所谓磨刀不误砍柴工,对于数理基础薄弱的人,强化一下理论的学习是大有裨益的。

    普通人难以做到“一次学习”,经典知识总是在一次次回顾后才能有更深入的理解。这也是我选择「思维导图」作为学习工具的原因,发散性思考的模式能帮助迅速回忆起相关的知识。

    近一个月我对之前陆陆续续学习的统计知识进行了系统性的复习、知识点补充以及思维导图笔记的完善,在这里把完整的笔记和大家分享。

    导图概览

    f2b14d14d4c6728101658ec3fe1916cf.png

    描述性统计:表格和图形法

    572fbf0b9a1d035226914aa9c8a68b16.png

    描述性统计:数值方法

    f8836e5df3bee0111e2807ad38f663cc.png

    概率

    7f61cdc5b569a72cc4cc9875b7dcb212.png

    概率分布

    3d7677294cfb40bdb9cd9f7a7a6c6130.png

    抽样分布

    2a3edd536ed46f93b3089760bb807188.png

    区间估计

    8a0fdbaa57d817b137ab37679129487a.png

    假设检验

    02520eef0be5bf05a301b2a94cd7ba5a.png

    两总体均值& 比例的推断

    c10b3744fe886fd5a77cabfb2159e4a3.png

    总体方差的统计推断

    3c2df349db3ed80fe076d49dce0f0509.png

    多个比率的比较/ 独立性/拟合优度检验

    25a0e5cd9a862a6c06106beedff66eac.png

    以上内容截取自zy

    后台回复【统计】领取

    数据分析就业班

    · 适合人群:

    1.转行(岗位相关,专业相关、对数据分析感兴趣)

    2.从事数据分析工作,但是需要提升技能以及增加实战经验

    3.应届毕业生入职数据分析

    戳 “阅读原文”入职数据分析! 返回搜狐,查看更多

    责任编辑:

    展开全文
  • 单因素方差分析(为什么高级心统老师讲“边际均值比较”更常用?) 2.1 安装相关R包,并找出数据(来源“agridat,将数据命名dat)。这里使用devtools下载github上的文件,devtools后面的格式是install_github(...

    说明:本文章中为作者R学习笔记,资料及操作流程均来源网络,侵权删!

    本文源代码“使用R做方差分析源代码.R”

    1. 方差分析假定:正态性(否则建立广义线性模型),独立性(否则建立混合线性模型,定义G矩阵和R矩阵),齐次性(否则混合线性模型,定义G矩阵和R矩阵)

    2. 单因素方差分析(为什么高级心统老师讲“边际均值比较”更常用?)

    2.1 安装相关R包,并找出数据(来源“agridat,将数据命名dat)。这里使用devtools下载github上的文件,devtools后面的格式是install_github("Package Name","Author Name"),::的作用可以理解成当有多个包下有同 一名字函数时,可以用::指定包

    # install.packages("agridat")
    # install.packages("devtools")
    # devtools::install_github("kwstat/agridat")#这一步是利用devtools下载github上的数据
    
    library(agridat)
    
    #单因素方差分析-数据
    data(lasrosas.corn)
    dat <- lasrosas.corn
    str(dat)

    2.2 方差分析代码格式:“m1 = aov(yield ~ nf, data=dat)”,m1为模型保存的名称,aov为R中的方差分析代码,yield为因变量,~波浪号前后分开Y与X变量,nf为X变量(种类),data=表示数据库用哪一个,dat为数据库名称

    m1 = aov(yield ~ nf, data=dat)
    summary(m1)

    2.3 这里在查看数据库时,前面用到str()函数,它是用来紧凑的显示对象内部结构,也就是对象里面有什么,除此之外还可以用head()函数表示,但这种方式只可以查看数据前6行数据。summary()函数可以获取描述性统计量,也就是显示出方程或者其他分析的结果

    3. 单因素区组

    代码格式:“m2 = aov(yield ~ block +trt, data=dat”+分割预测变量)

    #单因素随机区组-建模
    m2 = aov(yield ~ block +trt, data=dat)
    summary(m2)

    4. 两因素方差分析(无交互)-用新的数据库

    #两因素方差分析(无交互)-数据库
    data(lucas.switchback)
    dat <-lucas.switchback
    str(dat)
    #两因素方差分析(无交互)-建模
    m3 = aov(yield ~ block +trt +period, data=dat)
    summary(m3)

    代码格式:“m3 = aov(yield ~ block +trt +period, data=dat)”(这里是将block也就是区组作为一个自变量了?而且这个区组是谁的区组?)

    5. 两因素方差分析(有交互)

    #两因素方差分析(有交互)-数据库
    data(lucas.switchback)
    dat <- lucas.switchback
    #两因素方差分析(有交互)-建模
    m4 = aov(yield ~ block +trt*period, data=dat)
    summary(m4)

    代码格式:“m4 = aov(yield ~ block +trt*period, data=dat”,这里trt*period是R中公式的简写,表示trt + period + trt: period,其中trt: period表示交互作用: 表示交互项,而*表示所有可能的交互项,比如说y ~ A*B*C可展开为y ~ A+B+C+A:B+A:C+B:C+A:B:C;还可以用.它表示包含除因变量外的所有变量,如果一个数据库中有ABC三列预测变量,那y.表示y ~ A+B+C;还可以用^表示交互项达到次数,如y~(A+B+C)^2表示y~A+B+C+A:B+A:C+B:C(奇怪这里不考虑A:B:C吗))(另外这里注意预测变量放置位置,一般来讲,越基础的效应越需要放在表达式前面,首先是协变量,然后是主效应,然后是交互效应,放置位置不同,可能会对结果产生较大的影响(这里的block也属于协变量吗)

    6. 多因素方差分析

    #多因素方差分析-数据库
    data(lucas.switchback)
    dat <- lucas.switchback
    #多因素方差分析-建模
    m5 = aov(yield ~ block + trt*period +cow, data=dat)
    summary(m5)

    代码格式:“m5 = aov(yield ~ block + trt*period + cow, data=dat)”(这里面为什么只考虑了trt和period之间的交互呢?)

    7. 数据正态性检验(这一步应该在前面,因为只有经历验证后是正态、独立、方差齐性的个体才能够进行方差分析),在这里可以使用球形检验(Shapiro-Wilk)检验,也可以用qqplot查看残差的图(这个不是在说明残差是否符合正态分布吗?),判断数据的正态性,也可以做直方图查看

    #正态性检验/齐性检验-数据库
    data(npk)
    dat <- npk
    str(dat)

    7.1 做直方图:(一般分析时,仅对Y变量进行正态性检验,如果是单因素或者多因素,也可以根据因素分组进行正态性检验;数据量大时,对于稍微偏态的数据,即使不太符合正态分布,也不影响结论)

    #正态性检验-画直方图
    hist(dat$yield)

    7.2 做qq图:(使用car软件包中的qqplot函数)“library(car)    qqPlot(dat$yield)”qqPlot的大小写一定要写对,否则会出错),这里可以看到数据是否落在置信区间里面

    #正态性检验-画qq图
    library(car)
    qqPlot(dat$yield)
    shapiro.test(dat$yield)

    7.3 使用Shapiro-wilk检验数据正态分布:“shapiro.test(dat$yield)”,可以根据结果中的P值;来看,如果大于0.05,则报名数据符合正态分布

    #使用Shapiro-wilk检验数据正态分布
    shapiro.test(dat$yield)

    8. 齐性检验,可以使用Bartlet检验和Levene检验、

    8.1 Bartlett检验(对数据的正态性非常敏感):“Bartlett.test(yield ~ N, data=dat)”(这里不清楚~ N是什么意思?),可以根据P值判断,如果P大于0.05,则表明方差齐性

    #齐性检验-Bartlett检验
    bartlett.test(yield ~ N, data=dat)

    8.2 Levene检验(非参数检验方法,使用范围更广):“leveneTest(yield ~ N, data=dat)”

    #齐性检验-LeveneTest检验
    library(car)
    leveneTest(yield ~ N, data = dat)

    9. 多重比较

    #安装多重比较的包-LSD
    install.packages("agricolae")
    #多重比较-数据库
    data(npk)
    dat <- npk
    str(dat)

    9.1 首先进行方差分析,以对N进行单因素方差分析,block为区组,代码格式:“m9 = aov(yield ~ block + N, data=dat)”,结果显示显著

    #对N进行单因素方差分析,block为区组
    m9 = aov(yield ~ block + N, data = dat)
    summary(m9)

    9.2 LSD多重比较,代码格式:“re1 = LSD.test(m9,”N”)    re1$groups”(这里注意,需要下载agricolae包,并用library加载包),结果可以显示N中两个水平对应的yield值(这里注意,本来输出re1会出来很多结果的,但因为只看groups的结果,所以用了代码re1$groups),应该是可以通过这个进行比较,不过不清楚后面的ab对应于什么关系,以及没有P值呈现,如果是三个变量是不是就不好判断了?

    #LSD
    library(agricolae)
    re1 = LSD.test(m9, "N")

    Scheffe多重比较,代码格式:“(scheffe.test(m9,”N”))”,出来的结果比较多,不过最下面的结果和LSD的是一致的

    #scheffe多重比较
    (scheffe.test(m9, "N"))

    Tukey多重比较(保守,控制所有比较的误差),代码格式:“(HSD.test(m9, “N”)”,结果与scheffe的结果比较像

    #Tukey多重比较
    (HSD.test(m9,"N"))

    SNK多重比较(不如Tukey保守,只控制要比较的组),代码格式:“(SNK.test(m9, “N”))”

    #SNK多重比较
    (SNK.test(m9,"N"))

    Duncan多重比较(只比LSD稍微保守一点):“(Duncan.test(m9,”N”))”(这里只是自己实验了一下::的使用)

    #duncan多重比较
    aaa = agricolae::duncan.test(m9,"N")
    aaa

    10. 多重比较可视化:首先,需要对数据进行变化,由宽数据(数据集对所有变量进行了明确的细分,各变量的值不存在重复循环的情况也无法归类,总体表现为变量多而观察值少)变化为长数据(数据集中的变量没有做明确的细分,即变量中至少有一个变量中的元素存在值严重重复循环的情况,这种可以归为几类),表格整体的形状为长方形,即变量少儿观察值多。变化原因:宽数据无法用ggplot作图。(因为我使用的数据不用转化,所以就没有搞)

    10.1 首先找到数据(dat)并建模,得到显著结果后,进行LSD多重比较(这里需要用到agricolae

    #单因素方差分析-数据
    data(lasrosas.corn)
    dat <- lasrosas.corn
    #单因素方差分析-建模
    m1 = aov(yield ~ nf, data=dat)
    summary(m1)
    #多重比较可视化,dc=多重比较
    library(agricolae)
    dc = LSD.test(m1,"nf", alpha = 0.05)
    dc$groups

    10.2 因为作图需要标准误,所以先计算标准误,使用aggregate。

    #计算标准误,bw = 标准误
    bw = aggregate(yield ~ nf, dat, sd)#dat是数据,sd是要计算的标准误
    bw#查看标准误计算结果

    10.3 计算完成后得到bw文件,重新命名bw文件

    names(bw) = c("nf", "sd")#重新对bw的两列数据进行命名,这里的第二列数据的标题,会对应加上标准误那一行的sd,一定不要搞错
    bw#查看改变命名后的数据文件

    10.4 下载dplyr和tidyr包,合并数据,合并dc$groups和bw的数据

    install.packages("dplyr")
    install.packages("tidyr")
    library(dplyr)
    library(tidyr)
    
    #根据nf合并数据,dc$groups是dc文件中的groups结果,%>%管道
    dc2 = dc$groups %>% mutate(nf = rownames(dc$groups)) %>% inner_join(., bw, by = "nf")
    #这里很重要,不太理解是怎样将dc$groups中的N1等列数据加上nf名称的

    10.5 作图

    10.5.1直方图

    ##作直方图
    library("ggplot2")
    p1 = dc2 %>% ggplot(aes(x=nf,y=yield)) + geom_col(aes(fill = nf),width=.4)
    p1

    加标准误(这里的sd要注意,和前面重新命名bw那里的sd是一样)

    #加上标准误
    p2 = p1 +  geom_errorbar(aes(ymax = yield + sd, ymin = yield - sd),width = .1,size = .5)
    p2

    加显著性

    #加上显著性
    p3 = p2 +geom_text(aes(label = groups, y=yield + sd +0.5))
    p3

    背景设置为白色

    #背景设置为白色
    p4 = p3 + theme(panel.grid = element_blank(), panel.background = element_rect(color = "black",fill = "transparent"))
    p4

    增加标签

    #增加标签
    p5 = p4 + labs(x = "NF水平", y = "yield结果",title = "多重比较可视化")
    p5

    对横轴nf重新排序,并重新上面的几步

    #将顺序按照:N1,N2,N3,N4,N5,N0的顺序
    dc2$nf = factor(dc2$nf,levels = c("N1","N2","N3","N4","N5","N0"))
    #重新进行上面的几步
    p1 = dc2 %>% ggplot(aes(x=nf,y=yield)) + geom_col(aes(fill = nf),width=.4)
    p2 = p1 +  geom_errorbar(aes(ymax = yield + sd, ymin = yield - sd),width = .1,size = .5)
    p3 = p2 +geom_text(aes(label = groups, y=yield + sd +0.5))
    p4 = p3 + theme(panel.grid = element_blank(), panel.background = element_rect(color = "black",fill = "transparent"))
    p5 = p4 + labs(x = "NF水平", y = "yield结果",title = "多重比较可视化")
    p5

    加趋势线

    #加趋势线
    p6 = p5 +geom_line(aes(group=""),color = "red")
    p6

    补充知识点

    1.LSD本质是做了多次t检验,同时没有进行矫正,所以一般不用

    2.当有协变量时,事后检验不能做

    3.事后多重比较的t值的df是方差分析表中error的df(有的报告t有的报告F,F其实是t的平方,它的自由度还是error中的df

    4.先验比较(操作中点击“对比(N)”)不需要事后检验

    展开全文
  • 主要方法是将模型参数的估计量与预先拟定的理论期望值进行比较,包括参数估计量的符号、大小、相互之间的关系,以判断其合理性。首先检验参数估计量的符号。例如,有下列煤炭行业生产模型:煤炭产量=-108.5427+0....
  • 多重共线性问题的几种解决方法在多元线性回归模型经典假设中,其重要假定之一是回归模型的解释变量之间不存在线性关系,也就是说,解释变量X1,X2,……,Xk中的任何一个都不能是其他解释变量的线性组合。...
  • 若不满足前提条件则宜采用更为稳健的非参数方法,比如常用的基于秩次的假设检验(秩和检验)。秩和检验时,我们的H0假设不再是均值相等,而是中位数代表的分布是否相同。 类似于方差分析中的独立样本的方差分析和区...
  • win7电脑多重网络怎么办win7电脑多重网络怎么办 1.任务栏上,点击"网络和共享中心"项,然后在网络和Internet面板上,点击"更改适配器设置"项; 2.在弹出的"网络连接"对话框上,右键单击"本地连接"项,选择"属性"; 3.接着在...
  • 多重重要性采样

    2020-12-23 08:28:01
    本文讨论一种能很好地改善该问题的技术——多重重要性采样。我们常常需要通过采样来估计某个已知部分结构特征的函数的积分(比如$f(x) = g(x)h(x)$,但函数的具体值却又严重依赖于一组额外的参数,这导致我们很难在...
  • 原标题:一种挽救你缺失数据的好方法——多重补插缺失数据——研究中的绊脚石在医学研究中,我们经常会碰到缺失数据。无论是因为实验设计的问题,或是检测手段精度,又或是医学实验中的不可抗力因素。一旦数据没有被...
  • 什么是Java泛型?什么是类型擦除?泛型常用的通配符有哪些?1 Java泛型1.1 泛型的使用-泛型类1.2 泛型的使用-泛型方法1.3 泛型的使用-泛型接口1.4 泛型定义和使用的注意事项2 泛型擦除2.1 通过两个例子证明Java类型...
  • 多重循环概述

    2021-08-09 17:47:33
    多重循环(嵌套循环),其实就是一个循环体内又包含另一个或多个完整的循环结构。每个循环结构都可以对应一个规律或重复性操作,多重循环就可以实现更为复杂的规律性程序。 多重循环语法。 // 外层循环 while ...
  • 跳出多重循环

    2021-01-14 03:35:16
    跳出单循环不管是什么编程语言,都有可能会有跳出循环的需求,比如枚举时,找到一个满足条件的数就终止。跳出单循环是很简单的,比如for i in range(10):if i > 5:print ibreak然而,我们有时候会需要跳出多重循...
  • ( )是目前比较常用的Python扩展库管理工具 【单选题】以下关于文件操作方法的描述中,错误的选项是( ) 【单选题】哪个音一共只有2个音名 【单选题】下面代码的输出结果是( ) x=10 y=3 print(x%y,x**y) 【单选题】程序...
  • Content线性回归的多重共线性1. 前提2. 由损失函数推导ω(基于最小二乘法OLS)3. 上述计算结果不成立3.1 多重共线性的机器学习解释3.2 多重共线性的解决4. Ridge & Lasso4.1 Ridge4.2 Lasso 线性回归的多重共线性...
  • 多重网格法求解雷诺方程学兔兔第2期(总第177期) 机 械 工 程 与 自动 化 NO.22013年4月 MECHAN1CAL ENGINEERING & AUT()MATl()N Apr.文章编号:1672—6413(2013)02—0070-02多重网格法求解雷诺方...
  • CSS 常用方法整理

    2021-05-29 20:17:23
    通过使用 CSS transform 属性,您可以利用以下 2D 转换方法: translate() // 方法从其当前位置移动元素(根据为 X 轴和 Y 轴指定的参数)。 //<div> 元素从其当前位置向右移动 50 个像素,并向下移动 100 ...
  • 多重引导管理器Grub使用详解1.问题的提出目前发行的Linux版本大多用LILO实现多系统引导,但不同版本的LILO有同样的一个问题:根分区(/boot分区)不能分在1024柱面(约8.4GB)以后,否则LILO不能安装或者安装后不能正确...
  • 文章目录多重共线性@[toc]1 什么是多重共线性1.1 多重共线性含义1.2 多重共线性产生原因2 多重共线性后果2.1 完全型2.2 不完全型3 多重共线性检验3.1 简单相关系数检验3.2 方差膨胀因子法3.3 经验法3.4 逐步回归检测...
  • 还有类似于最近距离决定填补法、回归填补法、多重填补方法、K-最近邻法、有序最近邻法、基于贝叶斯的方法等。 异常值通常被称为“离群点”,对于异常值的处理,通常使用的方法有下面几种: 1、简单的统计分析 拿到...
  • 多元线性回归中多重共线问题的解决方法综述摘要在回归分析中,当自变量之间出现多重共线性现象时,常会严重影响到参数估计,扩大模型误差,并破坏模型的稳健性,因此消除多重共线性成为回归分析中参数估计的一个重要...
  • 跳出单循环不管是什么编程语言,都有可能会有跳出循环的需求,比如枚举时,找到一个满足条件的数就终止。跳出单循环是很简单的,比如for i in range(10):if i > 5:print ibreak然而,我们有时候会需要跳出多重.....
  • 前言C: 对于很多同学来讲,上一篇,可以...但是如果认真敲完查老师的案例,应该是可以很容易看得懂一些参考答案的,只不过就是自己想不出来,甚至因而变得焦躁、钻牛角尖(为什么自己想不到,为什么别人可以想到?)...
  • File类及常用方法

    2020-12-29 11:05:04
    File类常用方法 createNewFile():当且仅当不存在具有此抽象路径名指定名称的文件时,不可分地创建一个新的空文件。 delete():删除此抽象路径名表示的文件或目录。 exists():测试此抽象路径名表示的文件或目录...
  • 在本文中,您可以阅读为什么多重共线性是一个问题,以及如何使用主成分分析(PCA)消除数据集中的多重共线性。 为什么多重共线性是一个潜在的问题? 多重共线性高度影响与问题相关的方差,也会影响模型的解释,因为它...
  • 多重线性回归模型的最终建立不仅仅拟合个方程就完事了,还需要进行适用条件的考察、模型的诊断以及改进模型的再评估等。 (1)拟合多重线性回归模型; (2)适用条件考察:线性、独立性、正态性、同方差性; (3...
  • JAVA的File类常用方法举例: 1.理解File的含义: (1)File是java的一个类 C:\Orivers 这是一个File对象 C:\Drivers\Lan\Realtek\Readme.txt 也是File对象。 (2)实现了Serializable, Comparable两大接口以便于其...
  • 打开网页浏览器提示:此网页包含重定向循环的解决打开网页浏览器提示:此网页包含重定向循环的解决 网页生成了过多的重定向。清除此网站的 Cookie 或...其实,浏览器已经提供给我们解决问题的办法了。 首先就是清除...
  • 统计学分析方法01 | 描述统计1.集中趋势分析2.离中趋势分析3.相关分析4.推论统计02 | 假设检验1.参数检验2.非参数检验03 | 信度分析1.重测信度法2.复本信度法编辑3.折半信度法编辑04 | 列联表分析05 | 相关分析1.单...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 73,967
精华内容 29,586
关键字:

多重比较常用的方法是什么