精华内容
下载资源
问答
  • 双因素方差分析

    千次阅读 2019-08-12 14:28:53
    统计学简介之十七——双因素方差分析 一、双因素方差分析定义 二、分析过程 2.1 数据结构 2.2 分析步骤

    统计学简介之十七——双因素方差分析

    一、双因素方差分析定义

    这里写图片描述

    二、分析过程

    2.1 数据结构

    这里写图片描述
    这里写图片描述

    2.2 分析步骤

    这里写图片描述
    这里写图片描述
    这里写图片描述
    这里写图片描述
    这里写图片描述

    展开全文
  • 01.前言在前面我们讲过简单的单因素方差分析,这一篇我们讲讲双因素方差分析以及多因素方差分析,双因素方差分析是最简单的多因素方差分析。单因素分析就是只考虑一个因素会对要比较的均值产生影响,而多因素分析是...

    4c82dfce000eb4704bc5e1dd4a8795cf.png

    ae23449ddaaf149e913ea335c7196b43.png

    01.前言

    在前面我们讲过简单的单因素方差分析,这一篇我们讲讲双因素方差分析以及多因素方差分析,双因素方差分析是最简单的多因素方差分析。

    单因素分析就是只考虑一个因素会对要比较的均值产生影响,而多因素分析是有多个因素会对均值产生影响。

    需要注意的是一个因素可能会有不同的水平值,即不同的取值。比如要判断某一款药对某种病症有没有效果,服用不同的剂量效果应该是不一样的,虽然因素都是服药这一个因素,但是不同的药剂量代表不同的水平。

    双因素(多因素)方差分析又可以分为两种,一种是有交互作用的,一种是没有交互作用的。啥意思呢?什么是交互作用呢?

    比如我们大家所熟知的,牛奶和药是不可以一起吃的,如果单独喝牛奶有助于身体蛋白质的补充,如果单独吃药可以有助于治疗病症,但是牛奶和药同时吃就会把两者的作用抵消掉。这种两者之间的相互作用就可以理解成是交互作用,当然了,有的时候交互是正向呢,有的时候是负向的。

    02.无交互作用方差分析

    现在有如下一份不同品牌不同地区的产品销量数据表,想要看一下不同品牌和不同地区这两个因素是否对销量有显著性影响:

    9bc04c845230c240aebb9e29b717b8b1.png

    我们先来看看无交互作用的双因素方差分析具体怎么做呢,所谓的无交互也就是假设品牌和地区之间是没有交互作用的,相互不影响,只是彼此单独对销量产生影响。

    前面单因素方差分析中,我们是用F值去检验显著性的,多因素方差分析也同样是用F值.

    F = 组间方差/组内方差。

    对于没有交互作用的多因素,可以单纯理解为多个单因素。也就是你可以单独去看品牌对销量的影响,然后再单独去看地区对销量的影响。

    那单独怎么看呢?这就回到了我们前面讲过的单因素方差分析。

    我们先来计算品牌的组内平方和:

    SSA = (每个品牌的均值 - 全部销量均值)^2*每个品牌内样本数
        = (344.20-328.45)^2*5 + (347.80-328.45)^2*5 + (337.00-328.45)^2*5 + (284.80-328.45)^2*5
        = 13004.55
    

    我们再来计算地区的组内平方和:

    SSB = (每个地区的均值 - 全体销量均值)^2*每个地区内样本数
        = (339.00-328.45)^2*4 + (330.25-328.45)^2*4 + (339.25-328.45)^2*4 + (318.25-328.45)^2*4
        = 2011.7
    

    接着我们来计算全部平方和:

    SST = (每个值-总体均值)^2
        = 17888.95
    

    除此之外还有一个平方和:

    SSE = SST - SSA - SSB
    

    这部分是除品牌和地区以外的其他因素所产生的,称为随机误差平方和。

    有了平方和以后,我们同样需要求取均方,而均方 = 平方和/自由度。

    SST的自由度 = 总水平数 - 1 = 19
    SSA的自由度 = 品牌的水平数 - 1 = 3
    SSB的自由度 = 地区的水平数 - 1 = 4
    SSE的自由度 = SSA的自由度*SSB的自由度 = 12

    平方和有了,自由度也有了,均方MS也就可以求出来了,接下来进入到最重要的F值求取,

    品牌因素的F值 = SSA/SSE
    地区因素的F值 = SSB/SSE

    最后可以通过查F值表获得在置信度为95%的情况下时的F边界值表,然后和实际的F值作比较,最后做出是否显著的判断。如下表:

    593be97ec41706c4273eba9ab034d998.png

    03.有交互作用方差分析

    某交通部门想要知道高峰期与路段是否会对汽车的行车时间有影响,通过人工采集得到了如下数据:

    e214deb8065ef1d889b4c76d09d13bbf.png

    本次分析需要考虑峰期与路段之间的交互作用,某些路段的峰期行车时间可能异常偏高或偏低等。

    和无交互作用的多因素方差分析流程类似,我们先计算峰期的平方和:

    SSA = (每个峰期内的均值-总体均值)^2*每个峰期内样本数
        = (23.2-20.25)^2*10 + (17.3-20.25)^2*10
        = 174.05
    

    再来计算路段的平方和:

    SSB = (每个路段内的均值-总体均值)^2*每个路段内样本数
        = (22.4-20.25)^2*10 + (18.1-20.25)^2*10
        = 92.45
    

    再来计算交互作用的平方和:

    SSAB = (每个路段&峰期内的均值-该路段内的均值-该峰期内的均值+总体均值)^2*每个区间内的样本数
         = (25.4-23.2-22.4+20.25)^2*5 + (21-23.2-18.1+20.25)^2*5 + (19.4-17.3-22.4+20.25)^2*5 + (15.2-17.3-18.1+20.25)^2*5
         = 0.05
    

    e63c99198503fdb8745c8b1cdb7cfa04.png

    接着计算全部平方和:

    SST = (每个值-总体均值)^2
        = 329.75
    

    最后来计算误差平方和:

    SSE = SST - SSA - SSB - SSAB
    

    SST的自由度 = 总样本数 - 1 = 19
    SSA的自由度 = 峰期数 - 1 = 1
    SSB的自由度 = 路段数 - 1 = 1
    SSAB的自由度 = SSA的自由度*SSB的自由度 = 1
    SSE的自由度 = SST的自由度 - SSA的自由度 - SSB的自由度 - SSAB的自由度

    经过求均方,查F表,就可得到如下表:

    4bb017a75e3362643fc222c6b4fd2af9.png

    04.方差分析与回归分析异同

    上面通过以有无交互作用的双因素方差分析为例,给大家把多因素方差分析中涉及到的计算过程都演示了一遍,实际工作中我们是不需要自己手动进行计算的,直接通过Excel、Python都可以计算得到。以后专门讲解工具如何实现。

    通过上面的多因素方差分析,我们就可以得出来不同因素对某一目标值(销量/行车时间等)的影响情况,你可能会有这样的疑问,那这和多元回归有什么区别呢?多元回归不也是求取多个x和一个y的关系么?那这两个是一样的吗?

    还是有些不太一样的,方差分析只是告诉你某个因素的影响显著不显著,而没有告你影响有多大,回归分析是告诉你具体影响有多大。方差分析是一种定性分析,解决有没有的问题;回归分析是一种定量分析,解决有多少的问题。


    本文为个人公众号<俊红的数据分析之路>,2019年10月19日所发原创,未经允许禁止转载。

    展开全文
  • 双因素方差分析(双因素ANOVA)在R中实现前文简介了单因素方差分析(单因素ANOVA,一组因子变量对应一组因变量)、单因素协方差分析(单因素ANCOVA,在单因素ANOVA的基础上,加入协变量,即一组因子变量和协变量对应一组...
    576dca7f1440bfd1b981a0bbba4e4de9.gif双因素方差分析(双因素ANOVA)在R中实现689d660defb7d3f94799b639cc21f59c.gif

    前文简介了单因素方差分析(单因素ANOVA,一组因子变量对应一组因变量)、单因素协方差分析(单因素ANCOVA,在单因素ANOVA的基础上,加入协变量,即一组因子变量和协变量对应一组因变量)在R语言中的实现方法,本篇继续简介双因素方差分析(双因素ANOVA)。双因素方差分析,顾名思义,两组因子变量对应一组因变量。

    本文使用的作图数据的网盘链接(提取码z4w4):https://pan.baidu.com/s/1J-9GsmoHuQ_CEpxeWyEQsA

    数据预处理

    示例数据说明

    我们首先将示例数据读到R中,并从中挑选部分数据作为演示。

    #读入文件,添加分组信息
    soil group soil
    #以 chao1 指数为例,同时将分组列转换为因子变量
    chao1 chao1$treat chao1$times str(chao1)
    head(chao1)

    275590200a69fda2d88a6f0d3b880937.png

    假设存在这么一个关注的问题:

    我们采集了来源于同一环境中的土壤(土壤类型一致),分为了3组,分别添加了三种类型的化学物质(a、b、c),并将土壤孵育了不同的时间(10、15、20、25 天)。在不同时间段收集样本后,通过16S测序,获得了土壤细菌群落的Alpha多样性指数,期望关注化学物质类型以及处理时间对土壤细菌群落的影响(关注交互作用)。对应于上述挑选出的测试数据“chao1”:sample,试验样本名称,土壤类型完全相同;treat,在土壤中添加的三种化学物质(a、b、c),这列作为分组列,需要转换为因子变量类型,各组处理间相互独立;times,土壤孵育时间(天数),这列作为分组列,需要转换为因子变量类型(尽管它本来是数值类型的,但必需转化为因子类型后,才可作为分组变量用于方差分析);chao1,Alpha多样性指数中的Chao1指数,数值变量。此处存在“化学物质类型”以及“土壤孵育时间”两组分组变量,对应于双因素,同时还需要关注二者的交互作用,接下来我们考虑使用双因素方差分析(双因素ANOVA)来探究化学物质类型以及处理时间是否对土壤细菌群落产生了显著影响。

    评估检验的假设条件

    双因素ANOVA建立在两组数据必须均服从正态分布,以及各组方差相等的基础上才能执行。

    正态性检验

    同单因素ANOVA的方法,可使用Q-Q图来检验正态性假设。这里需要检查两组(化学物质类型、处理时间)是否均满足。
    #QQ-plot 检查数据是否符合正态分布
    par(mfrow = c(1, 2))
    qqPlot(lm(chao1~treat, data = chao1), simulate = TRUE, main = 'QQ Plot', labels = FALSE)
    qqPlot(lm(chao1~times, data = chao1), simulate = TRUE, main = 'QQ Plot', labels = FALSE)

    使用car包中的qqPlot()来绘制Q-Q图,由图可知,我们的数据符合正态分布模型。

    bf2bad3124bdff28c4adf90a19e7ebca.png

    方差齐性检验同单因素ANOVA的方法,可使用Bartlett检验进行方差齐性检验。这里需要检查两组(化学物质类型、处理时间)是否均满足。
    #使用 Bartlett 检验进行方差齐性检验(p 值大于 0.05 说明方差齐整)
    bartlett.test(chao1~treat, data = chao1)
    bartlett.test(chao1~times, data = chao1)
    结果显示,我们的数据各组方差相等。a3b902e737aa85454289e13ab15a01ec.png

    双因素方差分析(双因素ANOVA)

    双因素ANOVA

    我们的数据通过了正态性检验和方差齐性检验,接下来进行双因素ANOVA。

    如果不满足上述前提假设,一是可以考虑转化数据(当然,我们需要确保转换后的数据能够被合理解释,否则将无意义);二是可以考虑使用非参数的检验方法,对于双因素方差分析的非参数替代方法,常使用Scheirer-Ray-Hare检验(rcompanion包scheirerRayHare())。双因素ANOVA的aov()函数书写为aov(y~A*B)的样式,表示考虑所有可能的交互项:A、B以及A和B的交互(A:B),其中A、B分别为两组因子变量。因此,双因素ANOVA的aov()函数也可书写为aov(y~A+B+A:B)的样式。此外,表达式中各效应存在主次顺序,即y~A*B与y~B*A的处理方式是不同的,一般情况下,越基础性的变量越应放在表达式前面。在这里,主因素(treat)在前,次因素(times)在后。
    #满足假设,双因素方差分析,详情使用 ?aov 查看帮助
    fit summary(fit)
    #上式等同于
    fit summary(fit)
    #查看各组均值及标准差
    aggregate(chao1$chao1, by = list(chao1$treat, chao1$times), FUN = mean)
    aggregate(chao1$chao1, by = list(chao1$treat, chao1$times), FUN = sd)

    双因素ANOVA结果表明,化学物质类型以及处理时间均对土壤细菌群落产生了显著影响,并且二者交互作用也显著。

    147e0740c6af9d58b57954f89204dcfc.png

    交互效应展示

    若想展示双因素ANOVA的交互效应,以查看数据分布,有多种方法可供选择。以下提供几种参考方法。
    #例如,interaction.plot() 函数,展示各组均值趋势
    interaction.plot(chao1$times, chao1$treat, chao1$chao1)
    66f3ea0fb404a992cc4b637d027743b7.png
    #再例如,boxplot() 函数,以箱线图展示各组数据分布
    boxplot(chao1~treat*times, data = chao1, col = c('#B3DE69', '#FDB462', '#80B1D3'))

    bd72a400b5aab31a1ad98905c28d00d9.png

    #再例如,gplots 包 plotmeans() 函数,展示了均值和误差棒(95% 置信区间,以及各组样本量大小
    library(gplots)
    plotmeans(chao1~interaction(treat, times), data = chao1, connect = list(c(1, 4, 7, 10), c(2, 5, 8, 11), c(3, 6, 9, 12)))
    33ab2a7d56be1f8301a269d60ce68845.png
    #再例如,HH 包 interaction2wt() 函数
    library(HH)
    interaction2wt(chao1~treat*times, data = chao1)

    ebc1c41af7e6fe9a247da2f6549409ff.png

    4794c13fc62af2e4ce6e6fe978e4fdd4.png

    576dca7f1440bfd1b981a0bbba4e4de9.gif链接689d660defb7d3f94799b639cc21f59c.gif

    R语言执行单因素协方差分析

    R语言执行单因素方差分析及多重比较

    R语言执行两组间差异分析Wilcox秩和检验

    R语言执行两组间差异分析T检验

    叶绿体/线粒体在线注释网站GeSeq

    线粒体在线注释网站MITOS

    R语言绘制蝴蝶(柱状)图

    R语言绘制双向柱状图

    R语言绘制分组柱状图

    R语言绘制堆叠柱状图

    R语言绘制饼图(扇形图)

    R语言绘制花瓣图

    ba2e64b2c7fe372316c634d55ebcb99e.gif

    48f6f83632c5e64571f3e7e62d22778c.png

    展开全文
  • 前面我们说了方差分析中的单因素方差分析,但是在实际工作中,影响因素...PART01 双因素方差分析如果将汽车颜色看成是影响销量的A因素,不同地区看成是影响销量的B因素,同时对A因素和B因素进行分析,即为双因素方差...
    f928648bb33cd7c135e75a7f6f6477ce.gif

    前面我们说了方差分析中的单因素方差分析,但是在实际工作中,影响因素往往不止一个,需要考虑两个或以上因素对实验结果的影响。比如某公司销售汽车,在销售时,除了要关注汽车的外形、价格、耗油量等因素以外,还要考虑地区差异是否对销量有影响。今天来看一下双因素方差分析。

    5c16b098ebbd9ce9858d326b04c96550.png

    PART

    01

    双因素方差分析

    如果将汽车颜色看成是影响销量的A因素,不同地区看成是影响销量的B因素,同时对A因素和B因素进行分析,即为双因素方差分析。

    双因素方差分析是指分析两个因素,即行因素和列因素,对试验结果的影响的分析方法。当两个因素对试验结果的影响是相互独立的,且可以分别判断出行因素和列因素对试验数据的影响时,可使用双因素方差分析中的无重复双因素分析,即无交互作用的双因素方差分析方法。当这两个因素不仅会对试验数据单独产生影响,还会因二者搭配而对结果产生新的影响时,便可使用可重复双因素分析,即有交互作用的双因素方差分析方法。今天分享个可重复双因素分析的实例。

    e2dd5c0b182e345773eefde5857115c2.png

    PART

    02

    双因素方差分析实例

    实例应用:可重复双因素分析方法分析何种因素对效益有显著性影响

    1、案例描述

    某企业为了了解4种方案(因素2)在4个不同地区(因素1)的销售额状况,分别将4种方案投入4个地区进行试验,现有各个方案在不同地区的3天销售额数据,如下图所示,要求分析不同地区、不同方案,以及二者相交互分别对销售额的影响。

    96e570412a07db98bad3afb1437c4750.png

    2、实例分析

    在假设为5%的显著性水平下使用可重复双因素分析法推断不同地区、方案以及两者之间的交互作用中哪些因素对销售额有显著影响。

    3、操作分析

    第1步:选择分析工具并设置相关参数。打开“数据分析”——“方差分析:可重复双因素分析”,确定,在弹出的对话框中设置,“输入区域”为“$A$1:$E$13”,设置“每一样本的行数”为“3”,设置“α”为“0.05”,在“输出选项”选择“输出区域”,设置为“$G$2”,确定。需要注意的是“每一样本的行数”为各因素每一水平搭配使用的次数。

    bde2d43c683709187d57de901fcd1699.png

    第2步:显示可重复双因素分析结果。如下图所示。

    d19e200b092b3e92d4f9929f66fc96be.png
    992dc12d3fca7c48a769098f1842f815.png

    4、决策分析

    分析结果第一部分的SUMMARY中,可看到各个方案对应地区的样本观测数、求和、样本平均数、样本方差等数据。在第二部分的“方差分析”中可看到,分析结果不但有样本[行因素/方案(因素2)]和列因素[地区(因素1)]的F统计量和F临界值,也有交互作用的F统计量和F临界值。

    对比3项F统计量和各自的F临界值,样本、列、交互的F统计量都大于F临界值,说明方案、地区都对销售额有显著的影响。此外,结果中3个P-value值都小于0.01,也说明了方案和地区以及二者之间的交互作用对销售额都有显著影响,所以,该公司在制定后续的销售决策时,应考虑这些因素对销售额增长的作用。

    欢迎关注公众号,访问更多精彩:数据之魅

    如需转载,请联系授权,谢谢合作。

    展开全文
  • 前言在前面我们讲过简单的单因素方差分析,这一篇我们讲讲双因素方差分析以及多因素方差分析,双因素方差分析是最简单的多因素方差分析。单因素分析就是只考虑一个因素会对要比较的均值产生影响,而多因素分析是有多...
  • 概念:双因素方差分析,用于分析2个定类数据与定量数据之间的关系情况。例如研究性别、学历对网购满意度的影响差异;以及男(女)性中,不同学历是否有着网购满意度差异性;或者同一学历时,不同性别是否有着网购...
  • 在无交互作用的双因素方差分析中,行因素和列因素对因变量的影响是相互独立的。但是如果两个因素搭配在一起对因变量的影响会形成一个新的效应,就需要考虑交互作用对因变量的影响, 这就是有交互作用的双因素方差...
  • 在往期的文章里,介绍过单因素方差分析[R语言统计篇:单因素方差分析],今天介绍双因素方差分析(Two-way ANOVA)。此方法用于检验两个分类变量(自变量)与一个连续变量(因变量)之间的关系。比方说,如果一个分类变量有...
  • 双因素方差分析和单因素方差分析

    千次阅读 2018-04-12 15:29:00
    双因素方差分析(Double factor variance analysis) 有两种类型:一个是无交互作用的双因素方差分析,它假定因素A和因素B的效应之间是相互独立的,不存在相互关系;另一个是有交互作用的双因素方差分析,它假定因素A...
  • 基础实验由于分组的细化,涉及的统计...这里有两个因素,可考虑用双因素方差分析。SPSS操作如下:1、首先设定变量,其中a、b为两个因素,x为检测得到的数值。2、在数据视图中输入各变量的数值(数值参考书籍《临床...
  • 自变量只有一个时,又称为单因素方差分析(one-way ANOVA)当设计包含两个甚至更多的因子时,便是因素方差分析设计,比如两因子时称作双因素方差分析,三因子时称作三因素方差分析,以此类推。若因子设计包括组内和组...
  • 双因素方差分析结果中,如果显示"交互作用"具有统计学意义,那么经常需要结合"单独效应"进一步分析处理因素的实验效应。那么今天就着重介绍方差分析中的"单独效应"分析。案例:翻转课堂与分层合作教学对初中生体质...
  • 双因素方差分析 1. 双因素方差分析的理论 2. 双因素方差分析的实现
  • 双因素方差分析方法

    2010-06-02 12:48:50
    双因素双因素方差分析方法双因素方差分析方法方差分析方法双因素方差分双双因素方差分析方法因素方差分析方法析方法
  • ####双因素方差分析,可进行有交互作用与无交互作用 def f_twoway(df_c,col_fac1,col_fac2,col_sta,interaction=False): df=df_c.copy() list_fac1=df[col_fac1].unique() list_fac2=df[col_fac2].unique() r=...
  • 一、双因素方差分析的种类 在现实中,常常会遇到两个因素同时影响结果的情况。这就需要检验究竟一个因素起作 用,还是两个因素都起作用,或者两个因素的影响都不显著。 双因素方差分析有两种类型:一种是无交互作用...
  • 文章来源: 丁点帮你作者:丁点helper看完单因素方差分析,一般的统计学教课书中并不会直接讲two-way(双因素)方差分析,而是讲“随机区组设计的方差分析”,那这两者有什么关系吗?从统计方法的角度来看,随机区组...
  • 前面我们说了方差分析中的单因素方差分析,但是在...今天来看一下双因素方差分析。 PART 01 双因素方差分析 如果将汽车颜色看成是影响销量的A因素,不同地区看成是影响销量的B因素,同时对A因素和B因素进行分析...
  • 0.双因素方差分析的分类 无交互作用的方差分析 假定因素AAA和因素BBB的效应之间是相互独立的,不存在相互关系。 有交互作用的方差分析 假定因素AAA和因素BBB的结合会产生出一种新的效应。 无交互作用的双因素方差...
  • ''' ...#双因素方差分析 import pandas as pd import numpy as np from statsmodels.formula.api import ols from statsmodels.stats.anova import anova_lm data = pd.DataFrame([[1, 1, 32], ...
  • 正好现在趁着圣诞节,元旦放假,有时间把双因素ANOVA补上。其实也想了很久,双因素确实比单因素可以涉及的点多很多,一篇文章并不能写完,写太详细,读者看着觉得无聊,我自己也觉得无聊。所以,笔者思来想去,还是...
  • 在以往的推文中介绍了如何用python实现单因素方差分析,今天我们以《统计学》书中例子中的数据为例,用python实现无交互作用双因素方差分析。在无交互作用的双因素方差分析中,由于存在两个因素,因此在获取数据时,...
  • 本博文源于《商务统计》中的方差分析,旨在解决讲述一般的双因素方差分析双因素方差分析是建立在单因素方差分析的基础上。
  • 重复测量方差分析sunqi2020/7/26概述双因素的重复测量资料方差分析代码数据获得library(tidyverse)library(ggpubr)library(rstatix)rm(list=ls())set.seed(123)data("selfesteem2", package = "datarium")# 抽样self...
  • 7.2 双因素方差分析 7.2.2 双因素方差分析的数据结构 7.2.3 因素方差分析模型 1. 无交互作用的双因素方差分析模型 2. 有交互作用的双因素方差分析模型 7.3 一元线性回归分析 相关关系的类型 7.3.2 一元线性回归模型 ...

空空如也

空空如也

1 2 3 4 5 ... 11
收藏数 205
精华内容 82
关键字:

双因素方差分析