精华内容
下载资源
问答
  • 本博文源于《商务统计》中的方差分析,旨在解决讲述一般的双因素方差分析。双因素方差分析是建立在单因素方差分析的基础上。

    本博文源于《商务统计》中的方差分析,旨在解决讲述一般的双因素方差分析。双因素方差分析是建立在单因素方差分析的基础上。
    统计|如何简单理解单因素方差分析

    双因素方差分析简要介绍

    双因素方差分析目的:分析两个因素对实验结果的影响。
    双因素方差分析种类:如果两个因素对实验结果的影响是相互独立的,分别判断单独因素对实验数据的影响,这时叫做无重复双因素方差分析。 如果有联系,那么叫做可重复双因素方差分析。

    双因素方差分析基本假定

    • 每个总体都服从正态分布:对于因素的每一个水平,其观察值是来自正态分布总体的简单随机样本。
    • 各个总体的方差必须相同:对于各组观察数据,是从具有相同方差的总体中抽取的。
    • 观察值是独立的

    双因素方差分析的数据结构

    在这里插入图片描述
    在这里插入图片描述

    无重复双因素方差分析的一般步骤

    提出假设

    对行因素提出的假设:
    H0:μ1=μ2=...=μi=....=μk(μii)H1:μi(i=1,2,....,k) H_0:\mu_1=\mu_2=...=\mu_i=....=\mu_k(\mu_i为第i个水平的均值)\\ H1:\mu_i(i=1,2,....,k)不全相等
    对列因素提出的假设:
    H0:μ1=μ2=...=μj=....=μr(μjj)H1:μj(j=1,2,....,r) H_0:\mu_1=\mu_2=...=\mu_j=....=\mu_r(\mu_j为第j个水平的均值)\\ H1:\mu_j(j=1,2,....,r)不全相等

    计算平方和(SS)

    跟单因素方差分析类似,也是需要计算一大堆的平方和:
    SST=i=1kj=1r(xijxˉˉ)2SSR=i=1kj=1r(xixˉˉ)2SSC=i=1kj=1r(xjxˉˉ)2SSE=i=1kj=1r(xijxiˉxjˉ+xˉˉ)2 总误差平方和 SST=\sum_{i=1}^k\sum_{j=1}^r(x_{ij}-\bar{\bar{x}})^2\\ 行因素误差平方和 SSR=\sum_{i=1}^k\sum_{j=1}^r(x_{i·}-\bar{\bar{x}})^2\\ 列因素误差平方和 SSC=\sum_{i=1}^k\sum_{j=1}^r(x_{·j}-\bar{\bar{x}})^2\\ 随机误差项平方和 SSE=\sum_{i=1}^k\sum_{j=1}^r(x_{ij}-\bar{x_{i·}}-\bar{x_{·j}}+\bar{\bar{x}})^2
    这里与单因素方差分析一样有一条关系:SST=SSR+SSC+SSE

    计算均方(MS)

    误差平方和除以相应的自由度
    三个平方和的自由度分别是:
    SSTkr1SSTk1SSTr1SST(k1)×(r1) 总误差平方和的SST的自由度为kr-1\\ 行因素平方和的SST的自由度为k-1\\ 列因素平方和的SST的自由度为r-1\\ 误差项平方和的SST的自由度为(k-1)\times{(r-1)}\\
    行因素的均方,记为MSR,计算公式为:

    MSR=SSRk1 MSR=\frac{SSR}{k-1}
    列因素的均方,记为MSC,计算公式为:

    MSC=SSCr1 MSC=\frac{SSC}{r-1}
    误差项的均方,记为MSE,计算公式为:

    MSE=SSE(k1)(r1) MSE=\frac{SSE}{(k-1)(r-1)}

    计算检验统计量

    检验行因素的统计量
    FR=MSRMSEF(k1,(k1)(r1)) F_R=\frac{MSR}{MSE}\sim{F(k-1,(k-1)(r-1))}
    检验列因素的统计量
    FC=MSCMSEF(r1,(k1)(r1)) F_C=\frac{MSC}{MSE}\sim{F(r-1,(k-1)(r-1))}

    双因素方差分析表

    在这里插入图片描述

    统计决策

    将统计量的值F与给定的显著性水平α\alpha的临界值FαF_\alpha进行比较,作出对原假设H_0的决策

    • 根据给定的显著性水平α\alpha在F分布表中查找相应的临界值FαF_\alpha
    • FR>FαF_R\gt{F_\alpha},拒绝原假设H0H_0,表明均值之间的差异是显著的,即所检验的行因素对观察值有显著影响。
    • FC>FαF_C\gt{F_{\alpha}},拒绝原假设H0H_0,表明均值之间有显著差异,即所检验的列因素对观察值有显著影响.

    可重复双因素方差分析的一般步骤

    平方和的计算

    xijlijlxiˉixjˉjxijˉijxˉˉn x_{ijl}为对应于行因素的第i个水平和列因素的第j个水平的\\ 第l行的观察值\\ \bar{x_{i·}}为行因素的第i个水平的样本均值\\ \bar{x_{·j}}为列因素的第j个水平的样本均值\\ \bar{x_{ij}}对应行因素的第i个水平和列因素的第j个水平的\\ 组合的样本均值\\ \bar{\bar{x}}为全部n个观察值的总均值

    SST=i=1kj=1rl=1m(xijlxˉˉ)2SSR=rmi=1k(xˉixˉˉ)2SSC=kmj=1r(xˉjxˉˉ)2:SSRC=mi=1kj=1r(xˉijxˉixˉj+xˉˉ)2SSE=SSTSSRSSCSSRC 总平方和 SST=\sum_{i=1}^k\sum_{j=1}^r\sum_{l=1}^m(x_{ijl}-\bar{\bar{x}})^2\\ 行变量平方和 SSR=rm\sum_{i=1}^k(\bar{x}_{i·}-\bar{\bar{x}})^2\\ 列变量平方和 SSC=km\sum_{j=1}^r(\bar{x}_{·j}-\bar{\bar{x}})^2\\ 交互用平方和:SSRC=m\sum_{i=1}^k\sum_{j=1}^r(\bar{x}_{ij}-\bar{x}_{i·}-\bar{x}_{·j}+\bar{\bar{x}})^2\\ 误差项平方和 SSE=SST-SSR-SSC-SSRC
    这里与单因素方差分析一样有一条关系:SST=SSR+SSC+SSE+SSRC

    可重复双因素方差分析表

    在这里插入图片描述
    一样的可以看临界值F和F理论值大小,也可以看P值

    例子:品牌与地区是否影响彩电销售(单因素)

    在这里插入图片描述

    提出假设

    • 对品牌因素提出的假设为
      H0:μ1=μ2=μ3=μ4()H1:μi(i=1,2,...,4)() H_0:\mu_1=\mu_2=\mu_3=\mu_4(品牌对销售量无显著影响)\\ H_1:\mu_i(i=1,2,...,4)不全相等(有显著影响)
    • 对地区因素提出的假设为

    H0:μ1=μ2=μ3=μ4=μ5()H1:μj(j=1,2,...,5)() H_0:\mu_1=\mu_2=\mu_3=\mu_4=\mu_5(地区对销售量无显著影响)\\ H_1:\mu_j(j=1,2,...,5)不全相等(有显著影响)

    检验统计量

    通过相应的统计软件进行绘制输出,
    在这里插入图片描述

    • 先比较FFcritF与F crit的值大小
    • 或者比较P-value跟0.05对比

    统计决策

    9.46E-05小于0.05说明可以拒绝原假设,即品牌跟销量有显著性差异,0.14367>0.05,不拒绝原假设,即地区对销量没有显著性差异。数学结论如下:
    FR=18.10777>Fα=3.4903,H0,FC=2.100846<Fα=3.2592,H0, F_R=18.10777\gt{F_\alpha}=3.4903,拒绝原假设H_0,说明彩电的品牌对销售量有显著影响。\\ F_C=2.100846\lt{F_\alpha}=3.2592,不拒绝原假设H_0,无证据表明销售地区对彩电的销售量有显著影响

    展开全文
  • 根据观测变量(即因变量)的数目,可以把多因素方差分析分为:单变量多因素方差分析(也叫一元多因素方差分析)与变量多因素方差分析(即多元多因素方差分析)。本文将重点讲述一元多因素方差分析,下篇文章将详细讲述...

    一、教学内容

    多因素方差分析,用于研究一个因变量是否受到多个自变量(也称为因素)的影响,它检验多个因素取值水平的不同组合之间,因变量的均值之间是否存在显著的差异。多因素方差分析既可以分析单个因素的作用(主效应),也可以分析因素之间的交互作用(交互效应),还可以进行协方差分析,以及各个因素变量与协变量的交互作用。
    根据观测变量(即因变量)的数目,可以把多因素方差分析分为:单变量多因素方差分析(也叫一元多因素方差分析)与多变量多因素方差分析(即多元多因素方差分析)。本文将重点讲述一元多因素方差分析,下篇文章将详细讲述多元多因素方差分析。
    一元多因素方差分析:只有一个因变量,考察多个自变量对该因变量的影响。例如:分析不同品种、不同施肥量对农作物产量的影响时,可将农作物产量作为观测变量,品种和施肥量作为控制变量。利用多因素方差分析方法,研究不同品种、不同施肥量是如何影响农作物产量的,并进一步研究哪种品种与哪种水平的施肥量是提高农作物产量的最优组合。
    01
    分析原理
    通过计算F统计量,进行F检验。F统计量是平均组间平方和与平均组内平方和的比。

    这里,把总的影响平方和记为SST,它分为两个部分,一部分是由控制变量引起的离差,记为SSA(组间离差平方和),另一部分是由随机变量引起的SSE(组内离差平方和)。即SST=SSA+SSE。
    组间离差平方和SSA是各水平均值和总体均值离差的平方和,反映了控制变量的影响。组内离差平方和是每个数据与本水平组平均值离差的平方和,反映了数据抽样误差的大小程度。
    通过F值看出,如果控制变量的不同水平对观测变量有显著影响,那观测变量的组间离差平方和就大,F值也大;相反,如果控制变量的不同水平没有对观测变量造成显著影响,那组内离差平方和就比较大,F值就比较小。
    同时,SPSS还会依据F分布表给出相应的相伴概率值sig。如果sig小于显著性水平(一般显著性水平设为0.05、0.01、或者0.001),则认为控制变量不同水平下各总体均值有显著差异,反之,则不然。一般地,F值越大,则sig值越小。
    02
    SPSS分析案例
    现在有一个公司员工的工资表,想看一下员工性别“gender”与接受教育年限“edu”这两个控制变量对员工“当前工资”的影响。采用多因素方差分析法,则要分别考虑“gender”、“edu”对“当前工资”的影响,称为主效应,还要考虑“gender*edu”对“当前工资”的影响,称为交互效应。
    (1)分析步骤:将数据导入SPSS后,选择:分析—— 一般线性模型——单变量

    (2)将“当前工资”选入因变量(也就是观测变量),将性别“gender”与受教育年限“edu”选入固定因子(也就是控制变量)。

    (3)选择“单变量”的“模型”,打开对话框后选择“全因子”,表示方差分析的模型包括所有因素的主效应,也包括因素之间的交互效应。然后“继续”。

    (4)打开“单变量”的“绘制”对话框,选择“gender”为横轴变量,选择“edu”为分线变量,单击“添加”,即显示这两个因素变量的交互作用,即 “gender*edu”这个交互作用变量。
    由于此例中“gender”只有两个水平,即男、女;而“edu”有多种水平。因此,如果主效应显著,则表明因素两种或多种水平之间存在显著性差异。事后可以继续对同一因素多个水平之间的均值差异进行比较,该过程称为多重比较。
    但实际上如果主效应和交互效应都达到显著,我们更关心在多因素交互作用下,因变量有什么影响。
    因此,如果交互效应显著的话,通常需要进行简单效应检验。所谓简单效应检验,是指一个因素的水平在另一个因素的某个因素的某个水平上的变异。例如我们本例中的,如果gender与edu之间存在显著的交互作用,我们可以检验当gender为“女”时,edu的各个水平之间的差异,称为edu在“女”性水平上的简单效应;以及在“男”性水平上edu各水平之间的差异,称为edu在“男”性水平上的简单效应。
    简单效应检验,实际上是把其中一个自变量固定在某一个特定的水平上,考察另一个自变量对因变量的影响。简单效应检验在SPSS里是用一个“MANOVA”命令来实现的。
    同理,当我们检验三个自变量时,若这些自变量之间的交互作用显著,需要进行简单简单效应检验,即一个因素的水平在另外两个因素的水平结合上的效应。
    也就是把两个因素固定在各自的某一个水平上,考察第三个因素对因变量的影响。也是用“MANOVA”命令来实现的。我们观察简单效应显著与否,是通过F值与sig值来看的,一般用sig值与我们设定的一个数值(0.05、0.01、或者0.001)来比较,若sig值大于该数值,说明简单效应不显著;反之,若sig值小于该数值,说明简单效应显著。

    (5)打开“选项”对话框,将左边三个控制变量均移入右边,“显示均值”,同时选中“描述统计”,选中“比较主效应”。

    (6)点击“确定”以后,就会在SPSS查看器里显示出结果。其中,最上面的那部分代码是我们所做的操作在SPSS里具体实现的步骤的代码。下面的表格是我们想要的结果,从表格里得出结论。

    (7)从下面的“主体间效应的检验”表格里,我们比较性别gender、受教育程度edu、及genderedu交互作用的F值及sig值,看到edu的F值最大,sig值最小,且sig<0.05。而gender与genderedu的sig值都大于0.05,得出结论:“gender”的主效应未达到显著,而“edu”的主效应达到显著,gender与edu的交互效应未达到显著(当交互效应达到显著时,进而可以进行简单效应检验结果),就不需要进行简单效应检验。则该公司员工“受教育程度”对员工“当前工资”的影响显著,而“性别”对“当前工资”的影响不明显。

    (8)下图为均值分布图,即为两因素edu与gender作用下,因变量员工工资的均值分布情况。通常,若交互效应不显著时,图中的因素分布线均为平行线;若交互效应显著,图中的因素分线不平行。
    此图中,将性别“gender”作为横轴变量,观察接受教育年限“edu”对因变量“当前工资”的影响。

    图中得出结论:当受教育年限为20年,一般为研究生水平的时候,男女工资差别不大;受教育年限为14年,一般为专科生水平,男女工资差别不明显。但当受教育年限为8年、10年、12年、17年的时候,男女工资差别较大,尤其为8年、17年的时候,男女工资差别尤其明显。

    二、备注

    相关资料已上传我的资源,下载链接https://blog.csdn.net/TIQCmatlab?spm=1011.2124.3001.5343

    展开全文
  • 一、方差分析简介1.1 方差分析基本思想通过分析研究不同变量的变异对总变异的贡献大小,确定控制变量对研究结果影响力的大小。如果控制变量的不同水平对结果产生了显著影响,那么它和随机变量共同作用,必然使结果有...

    a2994302-9511-eb11-8da9-e4434bdf6706.png

    一、方差分析简介

    1.1 方差分析基本思想

    通过分析研究不同变量的变异对总变异的贡献大小,确定控制变量对研究结果影响力的大小。

    • 如果控制变量的不同水平对结果产生了显著影响,那么它和随机变量共同作用,必然使结果有显著的变化
    • 如果控制变量的不同水平对结果没有显著的影响,那么结果的变化主要由随机变量起作用,和控制变量关系不大

    1.2 方差分析的前提条件

    1. 独立,各组数据相互独立,互不相关;
    2. 正态:即各组数据符合正态分布;
    3. 方差齐性:即各组方差相等。

    1.3 方差分析通常使用F统计量检验

    在spss中经常使用方差齐性检验(都是levene检验),

    • 一般情况下,只要sig值大于0.05就以认为方差齐性的假设成立,因此方差分析的结果应该值得信赖;
    • 如果sig值小于或等于0.05方差齐性的假设就值得怀疑,导致方差分析的结果也值得怀疑。

    SPSS会自动计算 F 统计值, F 服从 (k-1,n-k) 自由度的 F 分布(k 是水平数, n 为个案数), SPSS依据 F 分布表给出相应的相伴概率值。

    • 如果相伴概率值小于显著性水平(一般为0.05) ,则拒绝零假设,认为控制变量不同水下各总体均值有显著差异;
    • 反之,则认为控制变量不同水平下各总体均值没有显著差异。

    二、不同分析方法

    首先要理解实验的设计或模型的类型,选取正确的方法才能得出正确的结论

    2.1 单因素设计方差分析

    单因素方差分析测试某一个控制变量的不同水平是否给观察变量造成了显著差异和变动。

    2.2 随机区组设计方差分析

    又称配伍组设计。在进行统计分析时,将区组变异离均差平方和从完全随机设计的组内离均差平方和中分离出来,从而减小组内平方和(误差平方和),提高了统计检验效率。

    2.3 析因设计方差分析

    析因设计(Facorial design)是将两个或两个以上因素的各种水平进行排列组合、交叉分组的实验设计,是对影响因素的作用进行全面分析的设计方法,可以研究两个或者两个以上因素多个水平的效应,也可以研究各因素之间是否有交互作用并找到最佳组合。常见析因设计有: 2x2析因设计、IxJ两因素析因设计、IxJxK三因素析因设计。

    2.4 交叉设计方差分析

    交叉设计(cross-over design)是一种特殊的自身对照设计,它按事先设计好的实验次序,在各个时期对受试对象先后实施各种处理,以比较处理组间的差异。受试对象可以采用完全随机分为两组或分层随机化的方法来安排。

    2.5 拉丁方设计方差分析

    拉丁方设计(latin square design文库)是从横行和直列两个方向进行双重局部控制,使得横行和直列两向皆成单位组,是比随机单位组设计多一个单位组的设计。

    2.6 协方差分析

    协方差分析是将那些很难控制的因素作为协变量,在排除协变量影响的条件下,分析控制变量对观察变量的影响,从而更加准确地对控制因素进行评价。协方差分析要求协变量应是连续数值型,多个协变量间互相独立,且与控制变量之间也没有交互影响。单因素方差分析和多因素方差分析中的控制变量都是一些定性变量。而协方差分析中则包含了定性变量(控制变量),又包含了定量变量(协变量)。

    2.7 嵌套设计方差分析

    嵌套设计被称为巢式设计(nested design)有些教科书上称这类资料为组内又分亚组的分类资料。根据因素数的不同,套设计可分为二因素(二级)、三因素(三级)等设计。 将全部k个因素按主次排列,依次称为1级,2级 … k级因素,再将总离差平方和及自由度进行分解,其基本思想与一般方差分析相同。所不同的是分解法有明显的区别,它侧重于主要因素,并且,第i级因素的显著与否,是分别用第i级与第i+1级因素的均方为分子和分母来构造F统计量,并以F测验为其理论根据的。

    2.8 重复测量方差分析

    重复测量资料是由在不同时间点上对同一对象的同一观察指标进行多次测量所得,重复测量设计是在科研工作中常见的设计方法,常用来分析在不同时间点上该指标的差异。重复测量设计最主要的优点就是提高了处理组间的精确度,因为它可以通过对同一个体数据的分析估计出实验误差的大小。

    三、案例分析(后附源文件)

    3.1 析因设计方差分析

    举个例子,

    需求:分析A、B两种药物联合应用对红细胞增加数的影响,数据见表。

    根据数据表和需求,采用析因设计方差分析研究各因素之间是否有交互作用并找到最佳组合。

    a6994302-9511-eb11-8da9-e4434bdf6706.png

    操作步骤:

    aa994302-9511-eb11-8da9-e4434bdf6706.png

    ac994302-9511-eb11-8da9-e4434bdf6706.png

    b0994302-9511-eb11-8da9-e4434bdf6706.png

    b3994302-9511-eb11-8da9-e4434bdf6706.png

    !!!报告分析:

    b6994302-9511-eb11-8da9-e4434bdf6706.png
    此步骤形仅仅用于操作演示

    b9994302-9511-eb11-8da9-e4434bdf6706.png

    bb994302-9511-eb11-8da9-e4434bdf6706.png

    3.2 嵌套设计方差分析

    举个例子,

    需求:选取某种植物3个品种(Plant),在每一株内选取两片叶子(Leaf)(嵌套在植株因素下的第二个因素),用取样器从每一片叶子上选取同样面积的两个样本(两次重复),称取湿重,结果见表。对以上结果进行方差分析

    根据所选的数据符合嵌套设计方差分析方法(分为一级、二级...)

    be994302-9511-eb11-8da9-e4434bdf6706.png

    操作步骤:

    bf994302-9511-eb11-8da9-e4434bdf6706.png

    c5994302-9511-eb11-8da9-e4434bdf6706.png

    这一步骤非常重要!!!

    报告分析

    正确操作结果:

    c8994302-9511-eb11-8da9-e4434bdf6706.png

    错误操作结果:(没有进行相应的语法添加)

    ce994302-9511-eb11-8da9-e4434bdf6706.png

    3.3 重复测量方差分析

    举个例子,

    需求:某研究者欲了解一套新的锻炼方法的减肥效果,该研究者在某小学随机抽取了12名肥胖学生,随机分成两组!第一组每天下午按新的锻炼方法锻炼!第二组不参与新的锻炼,方法锻炼并于实验开始的第1、2、3个月分别测量学生体重减重情况,测量值如表

    根据数据特征(不同时间点对同一指标重复测量)采用重复测量方差分析

    cf994302-9511-eb11-8da9-e4434bdf6706.png

    操作步骤:

    d0994302-9511-eb11-8da9-e4434bdf6706.png

    d2994302-9511-eb11-8da9-e4434bdf6706.png

    d3994302-9511-eb11-8da9-e4434bdf6706.png

    !!!报告分析

    d4994302-9511-eb11-8da9-e4434bdf6706.png

    d6994302-9511-eb11-8da9-e4434bdf6706.png

    d8994302-9511-eb11-8da9-e4434bdf6706.png

    d9994302-9511-eb11-8da9-e4434bdf6706.png

    拓展:当测量时间不是等间距时:

    db994302-9511-eb11-8da9-e4434bdf6706.png

    点击获取

    案例数据pan.baidu.com

    待更新...

    展开全文
  • SPSS(二)SPSS实现多因素方差分析模型 单因素方差分析上一篇博客https://blog.csdn.net/LuYi_WeiLin/article/details/89917656已经介绍完毕 这篇博客我们主要来学习多因素方差分析 多因素方差分析,就是同时考虑...

    SPSS(二)SPSS实现多因素方差分析模型

    单因素方差分析上一篇博客https://blog.csdn.net/LuYi_WeiLin/article/details/89917656已经介绍完毕

    这篇博客我们主要来学习多因素方差分析

    多因素方差分析,就是同时考虑若干个控制因素的情况下,分别分析它们的改变是否造成观察变量的显著变动

    (多个自变量,一个因变量)自变量类型以分类变量为主也可以是连续变量,不过连续变量一般是通过找出它与因变量的回归关系来控制其影响,因变量为连续变量

    实例:同时考虑职业(以下三个职业)和性别对收入的影响

     

    以上面这个实例,如何写模型表达式呢?

    如果只研究职业的影响

    如果只研究性别的影响

    同时考虑职业和性别对收入的影响

    只考虑主效应,交互项在现实中没有统计学意义(当然在后面模型检验中也会给出其相应的检验P值),可以简写成

     

    方差分析模型常用术语

    • 因素(Factor)简单来说就是自变量

    因素是可能对因变量有影响的变量,一般来说,因素会有不止一个水平,而分析的目的就是考察或比较各个水平对因变量的影响是否相同。

    • 水平(Level)简单来说就是自变量的所有取值类型

    因素的不同取值等级称作水平,例如性别有男、女两个水平。

    • 单元(Cell)比如下面就是6个单元

    单元亦称试验单位(Experimental Unit),指各因素的水平之间的每种组合。指各因素各个水平的组合,例如在研究性别(二水平)、血型(四水平)对成年人身高的影响时,该设计最多可以有2*4=8个单元。注意在一些特殊的试验设计中,可能有的单元在样本中并不会出现,如拉丁方设计。

    • 元素(Element)

    指用于测量因变量值的观察单位,比如研究职业与收入间的关系,月收入是从每一位受访者处得到,则每位受访者就是试验的元素

    一个单元格内可以有多个元素,也可以只有一个,甚至于没有元素。

    这主要在一些特殊的设计方案中出现,如正交设计

    • 均衡(Balance)

    如果在一个实验设计中任一因素各水平在所有单元格中出现的次数相同,且每个单元格内的元素数均相同,则该试验是均衡的,否则,就被称为不均衡。不均衡的实验设计在分析时较为复杂,需要对方差分析模型作特别设置才能得到正确的分析结果。

    • 交互作用(Interaction)

    如果一个因素的效应大小在另一个因素不同水平下明显不同,则称为两因素间存在交互作用。当存在交互作用时,单纯研究某个因素的作用是没有意义的,必须分另一个因素的不同水平研究该因素的作用大小。

    因素的分类

    简单来说因素根据类型不同分为固定因素(分类的自变量)、随机因素(分类的自变量)、协变量(连续的自变量)

    • 固定因素(Fixed Factor)

    指的是该因素在样本中所有可能的水平都出现了。从样本的分析结果中就可以得知所有水平的状况,无需进行外推。

    绝大多数情况下,研究者所真正关心的因素都是固定因素。

    性别:只有两种

    疗法:只有三种

    • 随机因素(Random Factor)

    该因素所有可能的取值在样本中没有都出现,目前在样本中的这些水平是从总体中随机抽样而来,如果我们重复本研究,则可能得到的因素水平会和现在完全不同!

    这时,研究者显然希望得到的是一个能够“泛化”,即对所有可能出现的水平均适用的结果。这不可避免的存在误差,需要估计误差的大小,因此被称为随机因素。

    • 协变量(Covariates)

    指对因变量可能有影响,需要在分析时对其作用加以控制的连续性变量

    实际上,可以简单的把因素和协变量分别理解为分类自变量和连续性自变量

    当模型中存在协变量时,一般是通过找出它与因变量的回归关系来控制其影响

     

    方差分析模型的适用条件

    从模型表达式出发得到的提示

    各样本的独立性:只有各样本为相互独立的随机样本,才能保证变异的可加性(可分解性)

    正态性:即个单元格内的所有观察值系从正态总体中抽样得出

    方差齐:各个单元格中的数据离散程度均相同,即各单元格方差齐

    在多因素方差分析中,由于个因素水平组合下来每个单元格内的样本量可能非常少,这样直接进行正态性、方差齐检验的话检验效能很低,实际上没什么用,因此真正常见的做法是进行建模后的残差分析

     

    方差分析模型的检验层次

    1.对总模型进行检验

    2.对模型中各交互效应、主效应进行检验(要先分析交互项)

       2.1交互项有统计学意义:分解为各种水平的组合情况进行检验

       2.2交互项无统计学意义:进行主效应各水平的两两比较

     

    案例一:固定因素--因变量

    超市规模、货架位置与销量的关系

    现希望现希望考察对超市中销售的某种商品而言,是否其销售额会受到货架上摆放位置的影响,除此以外,超市的规模是否也会有所作用?甚或两者间还会存在交互作用?

    BerensonLevine1992)着手研究了此问题,他们按照超市的大小(三水平)、摆放位置(四水平)各随机选取了两个点,记录其同一周内该货物的销量。

     数据集如下

    1	A	45.0
    1	A	50.0
    1	B	56.0
    1	B	63.0
    1	C	65.0
    1	C	71.0
    1	D	48.0
    1	D	53.0
    2	A	57.0
    2	A	65.0
    2	B	69.0
    2	B	78.0
    2	C	73.0
    2	C	80.0
    2	D	60.0
    2	D	57.0
    3	A	70.0
    3	A	78.0
    3	B	75.0
    3	B	82.0
    3	C	82.0
    3	C	89.0
    3	D	71.0
    3	D	75.0

     

    第一步:检验一下实验是否为均衡实验

    分析--统计描述--交叉表

    各单元元素数量一致,所以为均衡实验

    第二步:模型检验

    分析--一般线性模型--单变量(单个因变量)

    结果解读

    首先校正模型的SIg.显著性检验小于显著性水平0.05,所以拒绝原假设,所以使用线性来拟合这个模型是有效的

    下面的截距、size、position、size*position和下面表达式相对应

     先观察主效应显著性为0.663大于显著性水平0.05,所以没有意义,可以剔除重新再做模型,假如不剔除会对后面有意义的产生影响,结果也会不准确

    如何剔除(分析--一般线性模型--单变量--设定)

     

    之后重建模型检验得到这样 

    之后我么就可以看主效应size、position两个固定因素各自的单因素方差分析,进行主效应各水平的两两比较

    具体详细就不讲了,大家可以参考我的博客https://blog.csdn.net/LuYi_WeiLin/article/details/89917656

     

     第三步:模型检验

    变量的独立性通过,正态检验和方差齐性我们通过残差图来查看

    分析--一般线性模型--单变量

    一般我们只关心这幅图 

    如何放大,只显示这张图(双击这张图)

    按照下面的选项操作

     

    残差图所有点都在正负3以内,没什么大问题,所以也满足正态检验和方差齐性,所以该题用多因素方差分析模型是适用的 

     

     

    估计边界均值

    所谓边际均值,就是在控制了其他因素之后,只是单纯在一个因素的作用下,因变量的变化,在普通的分析中,因变量的变化都是几个因素共同作用的结果.

     

    画出轮廓图

    交互项不影响,轮廓图几条应平行

     

    案例二:随机因素--因变量

    现希望研究四种广告的宣传效果有无差异,具体的广告类型为:店内展示、发放传单、推销员展示、广播广告。在本地区共有几百个销售网点可供选择,出于经费方面的考虑,在其中随机选择了18个网点进入研究,各网点均在规定长度的时间段内使用某种广告宣传方式,并记录该时间段内的具体销售额。为减小误差,每种广告方式在每个网点均重复测量两次。

    数据集如下

    1.0	1.0	41.0
    2.0	1.0	61.0
    2.0	1.0	44.0
    3.0	1.0	61.0
    3.0	1.0	86.0
    4.0	1.0	76.0
    4.0	1.0	75.0
    5.0	1.0	57.0
    5.0	1.0	75.0
    6.0	1.0	52.0
    6.0	1.0	63.0
    7.0	1.0	33.0
    7.0	1.0	52.0
    8.0	1.0	69.0
    8.0	1.0	61.0
    9.0	1.0	60.0
    9.0	1.0	43.0
    10.0	1.0	61.0
    10.0	1.0	69.0
    11.0	1.0	41.0
    11.0	1.0	43.0
    12.0	1.0	66.0
    12.0	1.0	51.0
    13.0	1.0	65.0
    13.0	1.0	60.0
    14.0	1.0	58.0
    14.0	1.0	52.0
    15.0	1.0	50.0
    15.0	1.0	55.0
    16.0	1.0	44.0
    16.0	1.0	52.0
    17.0	1.0	45.0
    17.0	1.0	45.0
    18.0	1.0	58.0
    18.0	1.0	60.0
    1.0	2.0	75.0
    1.0	2.0	68.0
    2.0	2.0	57.0
    2.0	2.0	75.0
    3.0	2.0	76.0
    3.0	2.0	83.0
    4.0	2.0	77.0
    4.0	2.0	66.0
    5.0	2.0	75.0
    5.0	2.0	66.0
    6.0	2.0	72.0
    6.0	2.0	76.0
    7.0	2.0	76.0
    7.0	2.0	70.0
    8.0	2.0	81.0
    8.0	2.0	86.0
    9.0	2.0	63.0
    9.0	2.0	62.0
    10.0	2.0	94.0
    10.0	2.0	88.0
    11.0	2.0	54.0
    11.0	2.0	56.0
    12.0	2.0	70.0
    12.0	2.0	86.0
    13.0	2.0	87.0
    13.0	2.0	84.0
    14.0	2.0	65.0
    14.0	2.0	77.0
    15.0	2.0	65.0
    15.0	2.0	78.0
    16.0	2.0	79.0
    16.0	2.0	80.0
    17.0	2.0	62.0
    17.0	2.0	62.0
    18.0	2.0	75.0
    18.0	2.0	70.0
    1.0	3.0	63.0
    1.0	3.0	58.0
    2.0	3.0	67.0
    2.0	3.0	82.0
    3.0	3.0	85.0
    3.0	3.0	78.0
    4.0	3.0	80.0
    4.0	3.0	87.0
    5.0	3.0	87.0
    5.0	3.0	70.0
    6.0	3.0	62.0
    6.0	3.0	77.0
    7.0	3.0	70.0
    7.0	3.0	68.0
    8.0	3.0	75.0
    8.0	3.0	61.0
    9.0	3.0	40.0
    9.0	3.0	55.0
    10.0	3.0	64.0
    10.0	3.0	76.0
    11.0	3.0	40.0
    11.0	3.0	70.0
    12.0	3.0	67.0
    12.0	3.0	77.0
    13.0	3.0	51.0
    13.0	3.0	42.0
    14.0	3.0	61.0
    14.0	3.0	71.0
    15.0	3.0	75.0
    15.0	3.0	65.0
    16.0	3.0	64.0
    16.0	3.0	78.0
    17.0	3.0	50.0
    17.0	3.0	37.0
    18.0	3.0	62.0
    18.0	3.0	83.0
    1.0	4.0	69.0
    1.0	4.0	54.0
    2.0	4.0	51.0
    2.0	4.0	78.0
    3.0	4.0	100.0
    3.0	4.0	79.0
    4.0	4.0	90.0
    4.0	4.0	83.0
    5.0	4.0	77.0
    5.0	4.0	74.0
    6.0	4.0	60.0
    6.0	4.0	69.0
    7.0	4.0	33.0
    7.0	4.0	68.0
    8.0	4.0	79.0
    8.0	4.0	75.0
    9.0	4.0	73.0
    9.0	4.0	65.0
    10.0	4.0	100.0
    10.0	4.0	70.0
    11.0	4.0	61.0
    11.0	4.0	53.0
    12.0	4.0	68.0
    12.0	4.0	73.0
    13.0	4.0	68.0
    13.0	4.0	79.0
    14.0	4.0	63.0
    14.0	4.0	66.0
    15.0	4.0	83.0
    15.0	4.0	65.0
    16.0	4.0	76.0
    16.0	4.0	81.0
    17.0	4.0	73.0
    17.0	4.0	57.0
    18.0	4.0	74.0
    18.0	4.0	65.0

    首先还是看实验是否均衡

     

    所以为均衡实验,因为网点是随机抽取的,所以不能用固定因素,要用随机因素

     

    有随机因素就没有总的模型检验了,该因素所有可能的取值在样本中没有都出现,总的表达式无法表达出来,所以就没有总的模型检验

    看交互项adstype * area  显著性大于0.05,剔除

     

    之后我们对adstype、area 进行单因素方差分析(随机因素就没有两两比较的方法了)

    adstype可以进行两两比对,划分同类子集

    模型检验

    残差分析


        

     总体在正负3以内,没超过正负4,还行

     看其轮廓图

    展开全文
  • spss多因素方差分析

    万次阅读 多人点赞 2014-01-13 21:14:54
    多因素方差分析 多因素方差分析是对一个独立变量是否受一个或个因素或变量影响而进行的方差分析。SPSS调用“Univariate”过程,检验不同水平组合之间因变量均数,由于受不同因素影响是否有差异的问题。在这个过程...
  • 因素方差分析的计算步骤

    千次阅读 2020-03-03 23:41:30
    假定实验或观察中只有一个因素(因子)A(比如说试剂浓度),有m个水平。各在每一种水平下,做n次实验。XijX_{ij}Xij​表示第j个水平下的第i次实验。 实验次数 A1水平 A2水平 … Am水平 1 X11X_{11}X11​ X...
  • 因素方差分析

    千次阅读 2019-08-12 14:28:53
    统计学简介之十七——双因素方差分析 一、双因素方差分析定义 二、分析过程 2.1 数据结构 2.2 分析步骤
  • 方差分析(1) ——单因素方差分析及Excel示例

    万次阅读 多人点赞 2019-06-27 14:23:12
    文章目录什么是方差分析建立假设[^mcp]检验统计量偏差平方和均方F检验统计量使用Excel进行方差分析结果说明 什么是方差分析 Wikipedia: Analysis of variance (ANOVA) is a collection of statistical models used ...
  • 因素方差分析 1. 双因素方差分析的理论 2. 双因素方差分析的实现
  • 方差分析就是对试验数据进行分析,检验方差相等的个正态总体均值是否相等,进而判断各因素对试验指标的影响是否显著,根据影响试验指标条件的个数可以区分为单因素方差分析、双因素方差分析多因素方差分析。...
  • (一)单因素方差分析概念理解步骤 ①是用来研究一个控制变量的不同水平是否对观测变量产生了显著影响。这里,由于仅研究单个因素对观测变量的影响,因此称为单因素方差分析。 ②单因素方差分析的第一步是明确...
  • 因素方差分析

    千次阅读 2015-10-05 21:21:22
    因素方差分析概念: 是用来研究一个控制变量的不同水平是否对观测变量产生了显著影响。这里,由于仅研究单个因素对观测变量的影响,...单因素方差分析步骤: 第一步是明确观测变量和控制变量。例如,上述问题中的
  • 因素方差分析(one-way analysis of variance)判断控制变量是否对观测变量产生了显著影响分析步骤1. 建立检验假设- h0:不同因子水平间的均值无差异- h1:不同因子水平间的均值有显著差异- 【注意】有差异,有可能...
  • Excel单因素方差分析

    2021-01-04 15:06:51
    因素方差分析 1 声明 本文的数据来自网络,部分代码也有所参照,这里做了注释和延伸,旨在技术交流,如有冒犯之处请联系博主及时处理。 2 单因素方差分析简介 针对类数据(一个因子个取值)的情况,对试验...
  • 在网上查看了很的方法分析步骤,自己看书觉得书上写的也不太清楚,作罢,自己结合假设检验的原理以及步骤写出了方差分析的基本步骤(主要是自己的理解。 方差分析是什么 用比较通俗的话来说就是,利用方差分析...
  • 使用方差分析:单因素方差分析

    千次阅读 2008-09-28 08:10:00
    技巧:使用方差分析:单因素方差分析 单因素方差分析是针对两个或个样本数据进行简单的方差分析的工具。此分析工具只针对一个因素进行。简而言之,就是研究某个因素对某种情况的影响。因素即影响因素,是一个独立...
  • 一、方差分析是什么? 方差分析(analysis of variance,ANOVA)是分析各类别变量(如区位)对数值变量(如销售额)的影响的一种统计方法。 二、方差分析的原理是什么? 方差分析是通过分析数据误差来检验类别...
  • 方差分析实用分析步骤总结

    千次阅读 2019-07-24 13:16:58
    以上这些分析两个及两个数据之间的差异情况都可以使用同一种分析方法——方差分析。 01. 概念 方差分析用于定类数据(X)与定量数据(Y)之间的差异分析,例如研究三组学生(X)的智商平均值(Y)是否有显著差异...
  • 在上一期中我们详细的讲解了多因素方差分析中简单效应的SPSS操作方法,以及数据分析结果的解读。今天我们进一步讲解如何对简单效应的成对比较进行统计图形的绘制。用到的是统计绘图软件GraphPad Prism​ 目前市面上...
  • 如果我们想要了解这些因素中哪些因素对产量有显著性影响,或各个因素之间的交互作用,以及对结果有显著影响的因素的最佳水平等,就必须先进行实验,再进行分析,最后做出判断。 PART 01 Excel中的方差分析 ...
  • 方差分析基本原理样本要求 独立性 各样本必须是相互独立的随机样本 样本含量尽可能相等或相差不大 可比性 样本均值不相同,可比较 正态性 ...基本原理由于各种因素的影响,方差分析研究的数据呈
  • 在试验中,把考察的指标称为试验指标,影响试验指标的条件称为因素因素可分为两类,一类是...方差分析(Analysis of Variance,简称ANOVA)主要用于验证两组样本,或者两组以上的样本均值是否有显著性差异(是否一致...
  • Origin如何做单因素方差分析

    千次阅读 2020-10-26 17:20:43
    那么对于平时的常用的统计方法——单因素方差分析,首选先要进行的是数据的正态性分析,符合正态后,我们可以使用单因素方差分析进行分析。 图文教程 数据的正态性检测 1. 打开origin软件,输入数据 ...
  • spss教程进行单因素方差分析(图文教程) 单因素方差分析原理 因变量:连续变量 自变量:分类 用来测试某一个控制变量的不同水平是否给观察变量造成显著差异和变动。 方差分析前提:不同水平下,各总体均值...
  • 如果我们想要了解这些因素中哪些因素对产量有显著性影响,或各个因素之间的交互作用,以及对结果有显著影响的因素的最佳水平等,就必须先进行实验,再进行分析,最后做出判断。 Excel中的方差分析 方差分析...
  • 多因素可重复方差分析 1 声明 本文的数据来自网络,部分代码也有所参照,这里做了注释和延伸,旨在技术交流,如有冒犯之处请联系博主及时处理。 2 多因素可重复方差分析简介 针对类数据(个因子个取值)的...
  • 多因素不重复方差分析 1 声明 本文的数据来自网络,部分代码也有所参照,这里做了注释和延伸,旨在技术交流,如有冒犯之处请联系博主及时处理。 2 多因素不重复方差分析简介 针对类数据(个因子个取值)的...
  • 因素方差分析例题.ppt 将一份试样分发给10个实验室,各室用同一分析方法对它独立的进行两次分析,得测得值如下表所示,试对这些数据进行分析
  • 由于方差分析的原理基本在所有概率论与数理统计的书中都可以找到,那么这里就直接以图片的形式呈现了。关于方差齐次性检验以后会补充。 简介 方差分析(Analysis of Variance,简称ANOVA),又称“变异数分析”,是R.A...
  • 用Python学分析 - 单因素方差分析

    千次阅读 2019-09-18 16:45:40
    因素方差分析(One-Way Analysis of Variance) 判断控制变量是否对观测变量产生了显著影响 分析步骤 建立检验假设 - H0:不同因子水平间的均值无差异  - H1:不同因子水平间的均值有显著差异  - 【注意】有差异...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 20,605
精华内容 8,242
关键字:

多因素方差分析步骤