精华内容
下载资源
问答
  • #LSD library(agricolae) re1 = LSD.test(m9, "N") Scheffe多重比较,代码格式:“(scheffe.test(m9,”N”))”,出来的结果比较多,不过最下面的结果和LSD的是一致的 #scheffe多重比较 (scheffe.test(m9, "N")) ...

    说明:本文章中为作者R学习笔记,资料及操作流程均来源网络,侵权删!

    本文源代码“使用R做方差分析源代码.R”

    1. 方差分析假定:正态性(否则建立广义线性模型),独立性(否则建立混合线性模型,定义G矩阵和R矩阵),齐次性(否则混合线性模型,定义G矩阵和R矩阵)

    2. 单因素方差分析(为什么高级心统老师讲“边际均值比较”更常用?)

    2.1 安装相关R包,并找出数据(来源“agridat,将数据命名dat)。这里使用devtools下载github上的文件,devtools后面的格式是install_github("Package Name","Author Name"),::的作用可以理解成当有多个包下有同 一名字函数时,可以用::指定包

    # install.packages("agridat")
    # install.packages("devtools")
    # devtools::install_github("kwstat/agridat")#这一步是利用devtools下载github上的数据
    
    library(agridat)
    
    #单因素方差分析-数据
    data(lasrosas.corn)
    dat <- lasrosas.corn
    str(dat)

    2.2 方差分析代码格式:“m1 = aov(yield ~ nf, data=dat)”,m1为模型保存的名称,aov为R中的方差分析代码,yield为因变量,~波浪号前后分开Y与X变量,nf为X变量(种类),data=表示数据库用哪一个,dat为数据库名称

    m1 = aov(yield ~ nf, data=dat)
    summary(m1)

    2.3 这里在查看数据库时,前面用到str()函数,它是用来紧凑的显示对象内部结构,也就是对象里面有什么,除此之外还可以用head()函数表示,但这种方式只可以查看数据前6行数据。summary()函数可以获取描述性统计量,也就是显示出方程或者其他分析的结果

    3. 单因素区组

    代码格式:“m2 = aov(yield ~ block +trt, data=dat”+分割预测变量)

    #单因素随机区组-建模
    m2 = aov(yield ~ block +trt, data=dat)
    summary(m2)

    4. 两因素方差分析(无交互)-用新的数据库

    #两因素方差分析(无交互)-数据库
    data(lucas.switchback)
    dat <-lucas.switchback
    str(dat)
    #两因素方差分析(无交互)-建模
    m3 = aov(yield ~ block +trt +period, data=dat)
    summary(m3)

    代码格式:“m3 = aov(yield ~ block +trt +period, data=dat)”(这里是将block也就是区组作为一个自变量了?而且这个区组是谁的区组?)

    5. 两因素方差分析(有交互)

    #两因素方差分析(有交互)-数据库
    data(lucas.switchback)
    dat <- lucas.switchback
    #两因素方差分析(有交互)-建模
    m4 = aov(yield ~ block +trt*period, data=dat)
    summary(m4)

    代码格式:“m4 = aov(yield ~ block +trt*period, data=dat”,这里trt*period是R中公式的简写,表示trt + period + trt: period,其中trt: period表示交互作用: 表示交互项,而*表示所有可能的交互项,比如说y ~ A*B*C可展开为y ~ A+B+C+A:B+A:C+B:C+A:B:C;还可以用.它表示包含除因变量外的所有变量,如果一个数据库中有ABC三列预测变量,那y.表示y ~ A+B+C;还可以用^表示交互项达到次数,如y~(A+B+C)^2表示y~A+B+C+A:B+A:C+B:C(奇怪这里不考虑A:B:C吗))(另外这里注意预测变量放置位置,一般来讲,越基础的效应越需要放在表达式前面,首先是协变量,然后是主效应,然后是交互效应,放置位置不同,可能会对结果产生较大的影响(这里的block也属于协变量吗)

    6. 多因素方差分析

    #多因素方差分析-数据库
    data(lucas.switchback)
    dat <- lucas.switchback
    #多因素方差分析-建模
    m5 = aov(yield ~ block + trt*period +cow, data=dat)
    summary(m5)

    代码格式:“m5 = aov(yield ~ block + trt*period + cow, data=dat)”(这里面为什么只考虑了trt和period之间的交互呢?)

    7. 数据正态性检验(这一步应该在前面,因为只有经历验证后是正态、独立、方差齐性的个体才能够进行方差分析),在这里可以使用球形检验(Shapiro-Wilk)检验,也可以用qqplot查看残差的图(这个不是在说明残差是否符合正态分布吗?),判断数据的正态性,也可以做直方图查看

    #正态性检验/齐性检验-数据库
    data(npk)
    dat <- npk
    str(dat)

    7.1 做直方图:(一般分析时,仅对Y变量进行正态性检验,如果是单因素或者多因素,也可以根据因素分组进行正态性检验;数据量大时,对于稍微偏态的数据,即使不太符合正态分布,也不影响结论)

    #正态性检验-画直方图
    hist(dat$yield)

    7.2 做qq图:(使用car软件包中的qqplot函数)“library(car)    qqPlot(dat$yield)”qqPlot的大小写一定要写对,否则会出错),这里可以看到数据是否落在置信区间里面

    #正态性检验-画qq图
    library(car)
    qqPlot(dat$yield)
    shapiro.test(dat$yield)

    7.3 使用Shapiro-wilk检验数据正态分布:“shapiro.test(dat$yield)”,可以根据结果中的P值;来看,如果大于0.05,则报名数据符合正态分布

    #使用Shapiro-wilk检验数据正态分布
    shapiro.test(dat$yield)

    8. 齐性检验,可以使用Bartlet检验和Levene检验、

    8.1 Bartlett检验(对数据的正态性非常敏感):“Bartlett.test(yield ~ N, data=dat)”(这里不清楚~ N是什么意思?),可以根据P值判断,如果P大于0.05,则表明方差齐性

    #齐性检验-Bartlett检验
    bartlett.test(yield ~ N, data=dat)

    8.2 Levene检验(非参数检验方法,使用范围更广):“leveneTest(yield ~ N, data=dat)”

    #齐性检验-LeveneTest检验
    library(car)
    leveneTest(yield ~ N, data = dat)

    9. 多重比较

    #安装多重比较的包-LSD
    install.packages("agricolae")
    #多重比较-数据库
    data(npk)
    dat <- npk
    str(dat)

    9.1 首先进行方差分析,以对N进行单因素方差分析,block为区组,代码格式:“m9 = aov(yield ~ block + N, data=dat)”,结果显示显著

    #对N进行单因素方差分析,block为区组
    m9 = aov(yield ~ block + N, data = dat)
    summary(m9)

    9.2 LSD多重比较,代码格式:“re1 = LSD.test(m9,”N”)    re1$groups”(这里注意,需要下载agricolae包,并用library加载包),结果可以显示N中两个水平对应的yield值(这里注意,本来输出re1会出来很多结果的,但因为只看groups的结果,所以用了代码re1$groups),应该是可以通过这个进行比较,不过不清楚后面的ab对应于什么关系,以及没有P值呈现,如果是三个变量是不是就不好判断了?

    #LSD
    library(agricolae)
    re1 = LSD.test(m9, "N")

    Scheffe多重比较,代码格式:“(scheffe.test(m9,”N”))”,出来的结果比较多,不过最下面的结果和LSD的是一致的

    #scheffe多重比较
    (scheffe.test(m9, "N"))

    Tukey多重比较(保守,控制所有比较的误差),代码格式:“(HSD.test(m9, “N”)”,结果与scheffe的结果比较像

    #Tukey多重比较
    (HSD.test(m9,"N"))

    SNK多重比较(不如Tukey保守,只控制要比较的组),代码格式:“(SNK.test(m9, “N”))”

    #SNK多重比较
    (SNK.test(m9,"N"))

    Duncan多重比较(只比LSD稍微保守一点):“(Duncan.test(m9,”N”))”(这里只是自己实验了一下::的使用)

    #duncan多重比较
    aaa = agricolae::duncan.test(m9,"N")
    aaa

    10. 多重比较可视化:首先,需要对数据进行变化,由宽数据(数据集对所有变量进行了明确的细分,各变量的值不存在重复循环的情况也无法归类,总体表现为变量多而观察值少)变化为长数据(数据集中的变量没有做明确的细分,即变量中至少有一个变量中的元素存在值严重重复循环的情况,这种可以归为几类),表格整体的形状为长方形,即变量少儿观察值多。变化原因:宽数据无法用ggplot作图。(因为我使用的数据不用转化,所以就没有搞)

    10.1 首先找到数据(dat)并建模,得到显著结果后,进行LSD多重比较(这里需要用到agricolae

    #单因素方差分析-数据
    data(lasrosas.corn)
    dat <- lasrosas.corn
    #单因素方差分析-建模
    m1 = aov(yield ~ nf, data=dat)
    summary(m1)
    #多重比较可视化,dc=多重比较
    library(agricolae)
    dc = LSD.test(m1,"nf", alpha = 0.05)
    dc$groups

    10.2 因为作图需要标准误,所以先计算标准误,使用aggregate。

    #计算标准误,bw = 标准误
    bw = aggregate(yield ~ nf, dat, sd)#dat是数据,sd是要计算的标准误
    bw#查看标准误计算结果

    10.3 计算完成后得到bw文件,重新命名bw文件

    names(bw) = c("nf", "sd")#重新对bw的两列数据进行命名,这里的第二列数据的标题,会对应加上标准误那一行的sd,一定不要搞错
    bw#查看改变命名后的数据文件

    10.4 下载dplyr和tidyr包,合并数据,合并dc$groups和bw的数据

    install.packages("dplyr")
    install.packages("tidyr")
    library(dplyr)
    library(tidyr)
    
    #根据nf合并数据,dc$groups是dc文件中的groups结果,%>%管道
    dc2 = dc$groups %>% mutate(nf = rownames(dc$groups)) %>% inner_join(., bw, by = "nf")
    #这里很重要,不太理解是怎样将dc$groups中的N1等列数据加上nf名称的

    10.5 作图

    10.5.1直方图

    ##作直方图
    library("ggplot2")
    p1 = dc2 %>% ggplot(aes(x=nf,y=yield)) + geom_col(aes(fill = nf),width=.4)
    p1

    加标准误(这里的sd要注意,和前面重新命名bw那里的sd是一样)

    #加上标准误
    p2 = p1 +  geom_errorbar(aes(ymax = yield + sd, ymin = yield - sd),width = .1,size = .5)
    p2

    加显著性

    #加上显著性
    p3 = p2 +geom_text(aes(label = groups, y=yield + sd +0.5))
    p3

    背景设置为白色

    #背景设置为白色
    p4 = p3 + theme(panel.grid = element_blank(), panel.background = element_rect(color = "black",fill = "transparent"))
    p4

    增加标签

    #增加标签
    p5 = p4 + labs(x = "NF水平", y = "yield结果",title = "多重比较可视化")
    p5

    对横轴nf重新排序,并重新上面的几步

    #将顺序按照:N1,N2,N3,N4,N5,N0的顺序
    dc2$nf = factor(dc2$nf,levels = c("N1","N2","N3","N4","N5","N0"))
    #重新进行上面的几步
    p1 = dc2 %>% ggplot(aes(x=nf,y=yield)) + geom_col(aes(fill = nf),width=.4)
    p2 = p1 +  geom_errorbar(aes(ymax = yield + sd, ymin = yield - sd),width = .1,size = .5)
    p3 = p2 +geom_text(aes(label = groups, y=yield + sd +0.5))
    p4 = p3 + theme(panel.grid = element_blank(), panel.background = element_rect(color = "black",fill = "transparent"))
    p5 = p4 + labs(x = "NF水平", y = "yield结果",title = "多重比较可视化")
    p5

    加趋势线

    #加趋势线
    p6 = p5 +geom_line(aes(group=""),color = "red")
    p6

    补充知识点

    1.LSD本质是做了多次t检验,同时没有进行矫正,所以一般不用

    2.当有协变量时,事后检验不能做

    3.事后多重比较的t值的df是方差分析表中error的df(有的报告t有的报告F,F其实是t的平方,它的自由度还是error中的df

    4.先验比较(操作中点击“对比(N)”)不需要事后检验

    展开全文
  • 作者:kervin微信号:kervin_zhao在科学研究的统计分析中,我们往往会遇到多重比较校正问题。多重比较校正的方法很多,如Bonferroni、False Discovery Rate(FDR)、Random-field Theory (RFT)等等,各种校正方法各有...

    0.jpeg

    作者:kervin

    微信号:kervin_zhao

    在科学研究的统计分析中,我们往往会遇到多重比较校正问题。多重比较校正的方法很多,如Bonferroni、False Discovery Rate(FDR)、Random-field Theory (RFT)等等,各种校正方法各有优劣,具体应用时要根据自己的统计分析的数据特点进行选择。本文,笔者对Bonferroni和False Discovery Rate(FDR)两种校正方法进行论述,特别是对于应用比较广的FDR校正方法,笔者用具体的例子详细阐述了其原理,并给出其Matlab程序。

    为什么要进行多重比较校正

    当在同一个数据集上进行多次统计检验时,就需要进行多重比较校正。举个简单的例子,A、B两组被试,我们从每个被试身上得出10个指标。如果我们要研究A、B两组被试的某一个指标是否存在显着差异,那么此时我们只做一次统计分析就行;假设这个指标的p值小于0.05,我们会认为这个指标在A、B两组之间存在显着差异,此时,我们犯错的概率(或者称为假阳性率)是5%。假设我们把这10个指标都进行了统计分析,即使每个独立的指标的p值都小于0.05,此时我们犯错的概率不再是5%,而是1-(0.95)^10=0.4013,也就是说此时我们犯错的概率达到40%多,这在统计学上是不可接受的。因此,需要进行多重比较校正。

    Bonferroni 校正方法

    Bonferroni校正方法非常简单,若单次显着性水平为0.05,那么Bonferroni 校正后的p值应该为0.05/n,其中n为统计比较的次数。Bonferroni 校正方法应该属于最严格的一种校正方法,当统计比较的次数比较多时,Bonferroni 校正后的p值会非常小,此时不推荐使用这种校正方法。当统计比较的次数较小时,如小于几十个时,可以尝试使用。

    FDR 校正方法

    这里,笔者主要对FDR校正方法的原理进行论述。FDR校正方法是Benjamini和Hochberg于1995年提出了一种多重比较校正的方法。其实,FDR具体的算法也有多种,如Storey法(由Storey等人提出)、Benjamini-Hochberg法(简称BH法)等。其中BH法目前应用最广,这里主要介绍这种方法的基本原理。

    基于BH法的FDR校正过程:

    第一步:将我们单独统计得到的一系列的p=[p1,p2,…,pn]从大到小进行重新排序,计为P=[P1,P2,…,Pn];

    第二步:按照以下公式计算每个P值所对应的校正前的FDR值,这里称之为Q值:Q = Pi* (n/r),Pi表示P中元素值,n是P值个数,r依次为n,n-1,…,1。

    第三步:对Q进行校正,得到FDR值。对于计算出来的Q=[Q1,Q2,…,Qn],若某一个Qi值大于前一位Qi-1值,则把Qi的值赋值为Qi-1;反之则保留相应的Q值。最终得到Q值称之为校正后的FDR值。

    第四步:按照重排序之前的顺序返回各个p值对应的校正后的FDR值。

    例子:假设p=[0.01, 0.005, 0.03, 0.03, 0.02, 0.04, 0.05],计算相应的校正后的FDR值。

    笔者按照上述步骤,自行编制相应的Matlab程序,计算过程和结果如下:

    按照上述第一步步骤,计算得到P=[0.0500, 0.0400, 0.0300, 0.0300, 0.0200, 0.0100, 0.0050];

    按照第二步中的方法,计算得到Q=[0.0500, 0.0467, 0.0420, 0.0525, 0.0467, 0.0350, 0.0350];

    按照第三步:得到校正后的FDR值为:FDR=[ 0.0500, 0.0467, 0.0420, 0.0420, 0.0420, 0.0350, 0.0350];

    最后,转换成原来的顺序:FDR=[0.0350, 0.0350, 0.0420, 0.0420, 0.0420, 0.0467, 0.0500].

    对于本例来说,如果总体的显着性水平设置为0.05,那么从得到的最后的FDR值来说,这几个p值都具有显着性差异。

    总结

    本文,笔者对为什么要进行多重比较校正做了简单介绍,并重点论述了FDR多重比较校正方法。关于本文中FDR校正对应的Matlab程序,如有朋友需要,请先转发本文到您的朋友圈,然后截图发给我(微信号:kervin_zhao),我会把相应代码发给您(原创不易,请大家理解)。对于多重比较校正遇到的问题,也可以加笔者进行交流。如果各位朋友觉得本文对您有帮助,也烦请各位积极转发本文到您的朋友圈,并点击文末右下方的“在看”。

    原创不易,请各位朋友积极转发,多多支持,您的每一次转发就会给我们的创作增加一份动力,谢谢!推荐阅读

    如何计算EEG信号的香农熵Shannon entropy(附Matlab程序)

    聊一聊置换检验Permutation test的原理

    脑科学研究中常用的神经电信号记录电极介绍

    大脑中的结构连接、功能连接和有效连接

    基于图论的复杂脑网络分析中的常用指标

    关注我们

    展开全文
  • level) Table virus rep. 3 d.f. 8 l.s.d. 8.93 6.3 多重比较 Fisher's protected least significant difference test virus Mean oo 36.90 a ff 36.33 a cc 24.40 b fc 12.87 c 6.4 结果可视...

    今天介绍一下单因素方差分析可视化的内容,主要是实现如下图:

    分组平均值+标准差

    1. 数据

    library(agricolae)
    data(sweetpotato)
    head(sweetpotato)
    str(sweetpotato)
    


    试验描述:

    这些数据与在秘鲁南部塔克纳省进行的一项实验相符。研究了两种病毒(Spfmv和Spcsv)的作用。处理方法如下:CC(Spcsv)=甘薯褪绿矮秆,FF(Spfmv)=羽状斑驳,FC(Spfmv y Spcsv)=病毒复合物和OO(见证)健康植物。每个小区种植甘薯50株,共12个小区。每次治疗重复3次,实验结束时评估总重量(千克)。病毒通过插条传播,插条在田间播种。

    2. 方差分析

    mod1 = aov(yield~virus,data=sweetpotato)
    summary(mod1)
    


    可以看出,不同病毒之间达到极显著。可以进行多重比较。

    3. 多重比较

    re = LSD.test(mod1,"virus")
    re
    

    结果:

    $statistics
       MSerror Df   Mean      CV  t.value      LSD
      22.48917  8 27.625 17.1666 2.306004 8.928965
    
    $parameters
            test p.ajusted name.t ntr alpha
      Fisher-LSD      none  virus   4  0.05
    
    $means
          yield      std r       LCL      UCL  Min  Max   Q25  Q50   Q75
    cc 24.40000 3.609709 3 18.086268 30.71373 21.7 28.5 22.35 23.0 25.75
    fc 12.86667 2.159475 3  6.552935 19.18040 10.6 14.9 11.85 13.1 14.00
    ff 36.33333 7.333030 3 30.019601 42.64707 28.0 41.8 33.60 39.2 40.50
    oo 36.90000 4.300000 3 30.586268 43.21373 32.1 40.4 35.15 38.2 39.30
    
    $comparison
    NULL
    
    $groups
          yield groups
    oo 36.90000      a
    ff 36.33333      a
    cc 24.40000      b
    fc 12.86667      c
    
    attr(,"class")
    [1] "group"
    

    4. 多重比较可视化

    re1 = re$groups
    re1
    
    # 计算品种标准误
    
    xx = aggregate(yield ~ virus, sweetpotato,sd)
    names(xx) = c("virus","sd")
    xx
    
    
    re2 = re1 %>% mutate(virus = rownames(re1)) %>% inner_join(.,xx,by="virus")
    re2
    
    # 作图
    ## 做直方图
    re2 %>% ggplot(aes(virus,yield)) + geom_col(aes(fill = virus), width=.4) + 
      geom_errorbar(aes(ymax = yield + sd, ymin = yield - sd),width = .1,size=.5)+ 
      geom_text(aes(label = groups,y = yield + sd +1.5)) + theme(panel.grid = element_blank(), panel.background = element_rect(color = "black",fill = "transparent"))
    
    

    5. 完整代码

    library(agricolae)
    data(sweetpotato)
    mod1 = aov(yield~virus,data=sweetpotato)
    summary(mod1)
    
    re = LSD.test(mod1,"virus")
    re
    
    re1 = re$groups
    re1
    
    # 计算品种标准误
    
    xx = aggregate(yield ~ virus, sweetpotato,sd)
    names(xx) = c("virus","sd")
    xx
    
    
    re2 = re1 %>% mutate(virus = rownames(re1)) %>% inner_join(.,xx,by="virus")
    re2
    
    # 作图
    ## 做直方图
    re2 %>% ggplot(aes(virus,yield)) + geom_col(aes(fill = virus), width=.4) + 
      geom_errorbar(aes(ymax = yield + sd, ymin = yield - sd),width = .1,size=.5)+ 
      geom_text(aes(label = groups,y = yield + sd +1.5)) + theme(panel.grid = element_blank(), panel.background = element_rect(color = "black",fill = "transparent"))
    
    
    

    6. R语言太难?来用Genstat吧

    6.1 导入数据

    6.2 选择方差分析模型


    结果:

    Analysis of variance
     
    Variate: yield
     
    Source of variation	d.f.	s.s.	m.s.	v.r.	F pr.
    virus	3	 1170.21	 390.07	 17.34	<.001
    Residual	8	 179.91	 22.49	 	 
    Total	11	 1350.12	 	 	 
     
     
    Message: the following units have large residuals.
     
    *units* 9	   -8.3	   s.e. 3.9
     
     
    Tables of means
     
    Variate: yield
     
    Grand mean  27.6 
     
    	virus	 cc	 fc	 ff	 oo
    		 24.4	 12.9	 36.3	 36.9
     
     
    Standard errors of differences of means
     
    Table	virus	 
    rep.	 3	 
    d.f.	 8	 
    s.e.d.	 3.87	 
     
     
     
    Least significant differences of means (5% level)
     
    Table	virus	 
    rep.	 3	 
    d.f.	 8	 
    l.s.d.	 8.93
    

    6.3 多重比较

    Fisher's protected least significant difference test
     
     
    virus
     
     
    		Mean	 
    	oo	 36.90	 a
    	ff	 36.33	 a
    	cc	 24.40	 b
    	fc	 12.87	 c
    

    6.4 结果可视化

    结果:

    欢迎关注我的公众号:育种数据分析之放飞自我。主要分享R语言,Python,育种数据分析,生物统计,数量遗传学,混合线性模型,GWAS和GS相关的知识。

    展开全文
  • 原标题:多重线性回归的结果解读和报告(SPSS实例教程)之前我们推送了“”,介绍了在应用多重线性回归模型之前所需要满足的8个适用条件,简单概括如下:(1) 自变量与因变量存在线性关系;(2) 残差间相互独立;(3) ...

    原标题:多重线性回归的结果解读和报告(SPSS实例教程)

    之前我们推送了“”,介绍了在应用多重线性回归模型之前所需要满足的8个适用条件,简单概括如下:

    (1) 自变量与因变量存在线性关系;

    (2) 残差间相互独立;

    (3) 残差服从正态分布;

    (4) 残差具有方差齐性;

    (5) 因变量为连续变量;

    (6) 自变量为连续变量或分类变量;

    (7) 自变量间不存在多重共线性;

    (8) 样本量应为自变量的20倍以上。

    同时我们也结合实际的研究数据,介绍了如何在SPSS中进行多重线性回归的操作。面对SPSS结果输出中众多的表格,很多时候会感觉一头雾水,不知所云,接下来我们将对多重线性回归的输出结果进行详细的解读。

    一、模型条件验证

    首先我们需要对上述的8个条件进行验证,来确保最终建立的回归模型有效。在上一期的内容里,我们通过观察数据结构进行了初步的判断,数据已经基本满足了条件(5) (6) (8)的要求,下面我们将对其他条件来进行一一验证。

    1. 验证各个自变量与因变量存在线性关系

    在结果输出的Charts部分,Partial Regression Plot输出了每个自变量与因变量之间形成的散点图,由散点图可以判断自变量age,weight及heart_rate与因变量VO2 max之间均呈现一定的线性关系,满足条件(1)。由于自变量gender为二分类变量,因此可以不用考察其与因变量VO2 max的线性关系。

    展开全文
  • afni在组水平进行混合效应建模分析,3dMEMA一般适用于个体水平3dREMLfit的结果进行组分析。但是无法像3dttest一样在组分析的同时进行Cluster correction。 1 将个体水平的残差文件进行组平均。 2 AFNI的聚类校正方法...
  • 多重线性回归分析SPSS操作与解读

    千次阅读 2020-12-19 08:55:17
    转自个人微信公众号【Memo_Cleon】的统计学习...在线性回归中,残差是一个非常重要的概念,它是估计值与观测值之差,表示因变量中除了分析的自变量外其他所有未进入模型的因素引起的变异,即不能由分析自变量估计...
  • C语言多重指针

    2021-05-21 04:48:19
    http://blog.csdn.net/edwzhang/article/details/72252732012多重指针指的是在一条语句中有2个或以上的*。代码如下:#include int main() {int i[] = {10, 20, 30, 40, 50};int *pa[] = {i, i+2, i+1, i+4, i+3};int...
  • 多重共线性详解

    千次阅读 多人点赞 2020-12-26 23:04:23
    目录 1、多重共线性的现象 2、出现的原因 3、判别标准 4、检验方法 5、多重共线性有什么影响 6、多重共线性处理方法 7、其他说明 8、多重共线性识别-python代码8.1、vif检验8.2 相关系数8.3 聚类 9、宏观把握共线性...
  • 多重重要性采样

    2020-12-23 08:28:01
    本文讨论一种能很好地改善该问题的技术——多重重要性采样。我们常常需要通过采样来估计某个已知部分结构特征的函数的积分(比如$f(x) = g(x)h(x)$,但函数的具体值却又严重依赖于一组额外的参数,这导致我们很难在...
  • 多重共线性问题的几种解决方法在多元线性回归模型经典假设中,其重要假定之一是回归模型的解释变量之间不存在线性关系,也就是说,解释变量X1,X2,……,Xk中的任何一个都不能是其他解释变量的线性组合。...
  • 创建一个多重图,其中的节点表示位置,边表示运输方式。边的属性反映每一种运输方式的成本和时间。预览边表。G = graph([1 1 1 1 1 1 2 2 2],[2 2 2 3 3 3 3 3 3],[],{'New York', 'Boston', 'Washington D...
  • 多重积分的MATLAB实现

    2021-05-08 05:11:50
    多重积分的MATLAB实现》由会员分享,可在线阅读,更多相关《多重积分的MATLAB实现(3页珍藏版)》请在人人文库网上搜索。1、Mg 分析实验二 实验二实验二 多重积分多重积分 目的和要求目的和要求 1. 学习 MATLAB 软件...
  • 其中经典的方法是泊松融合[4],它要解决的是如下问题: 如果我们要把源图像B融合在目标图像A上,令f表示融合的结果图像C,f*表示目标图像A,v表示源图像B的梯度,▽f表示f的一阶梯度即结果图像C的梯度,Ω表示要融合...
  • 多重共线性是如何影响回归模型的

    千次阅读 2021-10-11 08:54:13
    在机器学习面试中经常会被问到的一个问题是,特征如果存在多重共线性时为什么不能估计出最佳回归系数?本篇文章算是这个问题的标准答案 多重共线性是什么? 当回归模型中的自变量之间高度相关时,存在多重共线性。 ...
  • 多重继承

    2021-05-17 16:25:10
    多重继承 多重继承派生类 除去一个类从一个基类派生,C++还支持一个派生类同时继承多个基类 1.多重继承派生类的定义 如果已经定义了多个基类,那么定义多重继承的派生类的形式为: class 派生类名:访问标号1 基类名1...
  • 如果违背这一假定,即线性回归模型中某一个解释变量与其他解释变量间存在线性关系,就称线性回归模型中存在多重共线性。多重共线性违背了解释变量间不相关的古典假设,将给普通最小二乘法带来严重后果。这里,我们...
  • 上述计算结果不成立3.1 多重共线性的机器学习解释3.2 多重共线性的解决4. Ridge & Lasso4.1 Ridge4.2 Lasso 线性回归的多重共线性 1. 前提 线性回归的矩阵表示 y = XT × ω y\ =\ X^{T}\...
  • 多元线性回归是我们在数据分析中经常用到的一个方法,很多人在遇到多维数据时基本上无脑使用该方法,而在用多元线性回归之后所得到的结果又并不总是完美的,其问题实际上并不出在方法上,而是出在数据上。...
  • 说明前面已经介绍完了01背包和完全背包,今天介绍最后一种背包问题——多重背包。这个背包,听起来就很麻烦的样子。别慌,只要你理解了前面的两种背包问题,拿下多重背包简直小菜一碟。如果没有看过前两篇01背包和...
  • 邻接多重表 操作实现

    2021-12-05 19:52:24
    邻接多重表是一种比较重要的无向简单图存储结构,鉴于无向图在数据结构课程中的重要性,邻接表多重操作实现必须要予以解决。图论及其算法在编译原理中具有很重要的地位,图着色的寄存器分配就要用到无向简单图,所以...
  • 本文介绍了背包问题系列,主要包括:【1】 01-背包及其应用【2】完全背包及其应用【3】多重背包【1】01-背包及其应用:1.1、01-背包问题描述:有 N 件物品和一个容量为 C 的背包。第 i 件物品的重量是 w[i],价值是 ...
  • 多重积分的MATLAB实现Mg 分析实验二实验二 多重积分目的和要求1. 学习MATLAB软件中与二重积分和三重积分相关的命令与编程2. 利用MATLAB软件计算二重积分和三重积分预备知识1. 符号积分利用int 命令进行二重积分、...
  • function test clear;clc; N1=3;N2=4;N3=5; N4=2;... % N4*M4 toc disp(n4_m4) % ---------------------------------- 结果比较 -------------------------------------- isequal(F_n4_m4,n4_m4) end
  • 抽象类和多重继承

    2021-09-01 23:21:39
    抽象类和多重继承 一. 引言 图形的面积如何计算? 在现实生活中需要知道具体的图形才能求面积 问题:shape类有必要存在么? 二. 抽象类 面向对象中的抽象类 可用于表示现实世界中的抽象概念 是一种只能定义类型,...
  • Zemax学习笔记——多重结构使用方法

    千次阅读 2021-06-30 16:18:28
    Zemax多重结构常用来设计变焦镜头,扫描镜头,优化镜头测试的多光路干涉系统和使用多波长多参数变化的结构。 首先通过学习一个变焦镜头的例子来初步了解多重结构的功能。 实例一:简单变焦镜头 简单变焦镜头结构: ...
  • 机器学习:多重共线性

    2021-03-08 10:52:05
    1 什么是多重共线性
  • 文章目录多重共线性@[toc]1 什么是多重共线性1.1 多重共线性含义1.2 多重共线性产生原因2 多重共线性后果2.1 完全型2.2 不完全型3 多重共线性检验3.1 简单相关系数检验3.2 方差膨胀因子法3.3 经验法3.4 逐步回归检测...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 95,038
精华内容 38,015
关键字:

多重比较的结果如何表示