精华内容
下载资源
问答
  • Python数据分析案例-多因素方差分析

    千次阅读 2021-06-02 19:08:03
    使用Python进行多因素方差分析

    1. 前言

    背景:表格为随机挑选的不同性别与受教育程度的对象的幸福指数数据,

    目的:现要求分析幸福指数是否受不同的性别和受教育程度影响。

    分析方法:两个自变量是分类变量,因变量是连续变量,所以选择多因素方差分析。

    方差分析需要满足的条件:

    • 1.各样本须是相互独立的随机样本;
    • 2.各样本来自正态分布总体;
    • 3.各样本方差齐性。

    显著性水平:选取为0.05

    工具:Jupyter Notebook(Python 3.8)

    2. Python

    数据查看

    data = [['Male', '高中及以下', 63.0],
           ['Male', '高中及以下', 64.0],
           ['Male', '高中及以下', 60.0],
           ['Male', '高中及以下', 63.0],
           ['Male', '高中及以下', 66.0],
           ['Male', '高中及以下', 65.0],
           ['Male', '高中及以下', 61.0],
           ['Male', '高中及以下', 62.0],
           ['Male', '高中及以下', 68.0],
           ['Male', '大学本科', 66.5],
           ['Male', '大学本科', 67.0],
           ['Male', '大学本科', 69.5],
           ['Male', '大学本科', 70.0],
           ['Male', '大学本科', 69.0],
           ['Male', '大学本科', 71.5],
           ['Male', '大学本科', 67.0],
           ['Male', '大学本科', 68.5],
           ['Male', '大学本科', 63.5],
           ['Male', '研究生及以上', 88.0],
           ['Male', '研究生及以上', 89.0],
           ['Male', '研究生及以上', 86.0],
           ['Male', '研究生及以上', 92.0],
           ['Male', '研究生及以上', 90.0],
           ['Male', '研究生及以上', 84.0],
           ['Male', '研究生及以上', 91.0],
           ['Male', '研究生及以上', 87.0],
           ['Male', '研究生及以上', 88.0],
           ['Male', '研究生及以上', 85.0],
           ['Female', '高中及以下', 65.0],
           ['Female', '高中及以下', 66.0],
           ['Female', '高中及以下', 61.0],
           ['Female', '高中及以下', 64.0],
           ['Female', '高中及以下', 69.0],
           ['Female', '高中及以下', 70.0],
           ['Female', '高中及以下', 67.0],
           ['Female', '高中及以下', 63.0],
           ['Female', '高中及以下', 63.0],
           ['Female', '高中及以下', 66.0],
           ['Female', '大学本科', 70.0],
           ['Female', '大学本科', 71.0],
           ['Female', '大学本科', 66.0],
           ['Female', '大学本科', 69.0],
           ['Female', '大学本科', 74.0],
           ['Female', '大学本科', 73.0],
           ['Female', '大学本科', 72.0],
           ['Female', '大学本科', 68.0],
           ['Female', '大学本科', 65.0],
           ['Female', '大学本科', 64.0],
           ['Female', '研究生及以上', 82.0],
           ['Female', '研究生及以上', 83.0],
           ['Female', '研究生及以上', 88.0],
           ['Female', '研究生及以上', 91.0],
           ['Female', '研究生及以上', 90.0],
           ['Female', '研究生及以上', 86.0],
           ['Female', '研究生及以上', 84.0],
           ['Female', '研究生及以上', 80.0],
           ['Female', '研究生及以上', 85.0],
           ['Female', '研究生及以上', 76.0]]
    
    df = pd.DataFrame(data, columns = ['gender', 'education', 'Index'])
    df.head()
    

    在这里插入图片描述

    转换

    df1 = pd.DataFrame()
    data_list = []
    for i in df.gender.unique():
        for j in df.education.unique():
            data = df[(df.gender == i)&(df.education == j)]['Index'].values
            data_list.append(data)
            df1 = df1.append(pd.DataFrame(data, columns = pd.MultiIndex.from_arrays([[i],[j]])).T)
    df1 = df1.T
    df1
    

    在这里插入图片描述

    • 转换成更直观的形式,方便后续的操作

    各组数量统计

    # 查看各组数量分布
    df1.count().to_frame()
    

    在这里插入图片描述

    • 各组数量存在差异

    箱线图查看异常值

    plt.figure(figsize = (12,8))
    sns.boxplot(x = 'gender', y = 'Index', data = df, hue = 'education')
    plt.show()
    

    在这里插入图片描述

    • 各组数据均没有异常值

    正态性检验

    # Shapiro-Wilk 检验
    sw_test_res = pd.DataFrame()
    for i in df1.columns:
        statistic,pvalue = stats.shapiro(df1[i].dropna())
        sw_test_res[i]  = [statistic, pvalue]
    sw_test_res.index = ['statistic', 'p_value']
    sw_test_res.T.round(3)
    

    在这里插入图片描述

    • 以上各组p值均大于0.05,满足正态分布

    方差齐性检验

    # levene test
    print('基于中位数的levene test P值:', stats.levene(*data_list, center='median').pvalue)
    
    • P值为0.286,大于0.05,即任一分类都具有等方差性

    判断交互作用

    计算平均值

    df_mean = df1.mean().to_frame().unstack().round(1)
    df_mean.columns = ['大学本科', '研究生及以上', '高中及以下']
    df_mean = df_mean[['高中及以下', '大学本科', '研究生及以上']]
    df_mean
    

    在这里插入图片描述
    绘制交互图

    # 定义一个绘图函数
    def draw_pics(data, feature):
        fig, ax = plt.subplots(figsize=(8, 6)) 
        for i in data.index:
            ax.plot(data.columns, data.loc[i,], label = i, marker='o')
            ax.legend()
        ax.set_title("幸福指数平均值")
        ax.set_xlabel(feature, fontdict={'fontsize': 14})
        ax.set_ylabel("平均值", fontdict={'fontsize': 14})
        plt.show()
    # 绘制不同的性别在不同的教育程度下的均值变化
    draw_pics(data_mean, 'education')
    

    在这里插入图片描述

    # 绘制不同的教育程度在不同的性别下的均值变化
    draw_pics(data_mean.T, 'gender')
    

    在这里插入图片描述

    • 可以看到受教育程度与性别在对幸福指数的影响上可能存在交互作用。
    • 男性和女性的幸福指数都随受教育程度的增加而增加。但两者的增加趋势不同。男性的受教育程度在高中及以下、大学本科时幸福指数比女性低;但当男性的受教育程度达到研究生及以上时,其幸福指数比女性高。可见,在提高受教育程度增加幸福指数的过程中,男性比女性获益更大。

    多因素方差分析
    将交互项放入方差分析

    anova = smf.ols('Index ~ C(gender) + C(education) + C(gender)*C(education)',data = df).fit()
    sm.stats.anova_lm(anova, typ=1)
    

    在这里插入图片描述
    结果显示:

    • 性别P = 0.404大于0.05,表明性别对幸福指数没有影响
    • 教育P < 0.001,表明教育对于幸福指数有显著影响
    • 交互项具F(2,52)=4.148,P= 0.021,有统计学意义,表明性别和受教育程度在对幸福指数的影响上存在交互作用

    事后比较
    不同教育程度的事后比较

    # 事后多重比较 
    sm.stats.multicomp.pairwise_tukeyhsd(groups = df.education, endog=df.Index).summary()
    

    在这里插入图片描述
    由事后比较可得:

    • 大学本科学历 的幸福指数比 高中及以下学历 的人高4.13(95%CI:1.55-6.72),P=0.001;
    • 研究生及以上学历 的幸福指数比 高中及以下学历 的人高21.72(95%CI:19.17-24.28),P<0.001;
    • 研究生及以上学历 的幸福指数比 大学本科学历 的人高17.59(95%CI:15.04-20.15),P<0.001。

    单独效应的解释
    性别的单独效应

    # 性别的单独效应
    gender_pc_df = pd.DataFrame()
    for i in df.gender.unique():
        pc = sm.stats.multicomp.pairwise_tukeyhsd(groups = df.query("gender == @i").education, 
                                                  endog=df.query("gender == @i").Index).summary()
        pc_df = pd.DataFrame(pc, index = [i] * (df.education.nunique() + 1), )[1:]
        gender_pc_df = gender_pc_df.append(pc_df)
    
    gender_pc_df.columns = ['group1', 'group2', 'meandiff', 'p-adj', 'lower', 'upper', 'reject']
    gender_pc_df
    

    在这里插入图片描述
    从结果中可得:

    • 男性中:

      • 高中及以下学历 的幸福指数评分比 大学本科学历 的低4.50(95%CI:1.58 - 7.42),P = 0.0021;
      • 高中及以下学历 的幸福指数评分比 研究生及以上学历 的低24.44(95%CI:21.60 - 27.29),P = 0.001。
      • 大学本科学历 的幸福指数评分比 研究生及以上学历 的低19.94(95%CI:17.10 - 22.79),P = 0.001。
    • 女性中:

      • 高中及以下学历 的幸福指数评分比 大学本科学历 没有显著性差异,P = 0.071;
      • 高中及以下学历 比 研究生及以上学历 的低19.10(95%CI:15.02 - 23.17),P = 0.001。
      • 大学本科学历 的幸福指数评分比 研究生及以上学历 的低15.30(95%CI:11.23 - 19.37),P = 0.001。

    结论

    • 1.采用因素方差分析性别和受教育程度对幸福指数的影响,显著性水平选取为P = 0.05。满足方差分析前提条件:用分箱图检验没有异常值,用Shapiro-Wilk检验均满足正态性,用Levene方差齐性检验均满足等方差性(P = 0.286)。
    • 2.本研究中,性别对幸福指数没有影响(P = 0.404),教育对于幸福指数有显著影响(P < 0.001),性别和受教育程度在对幸福指数的影响上存在交互作用(P = 0.021)。
    • 3.不同性别中不同教育水平对于幸福指数的影响:
      男性中:
      - 高中及以下学历 的幸福指数评分比 大学本科学历 的低4.50(95%CI:1.58 - 7.42),P = 0.0021;
      - 高中及以下学历 的幸福指数评分比 研究生及以上学历 的低24.44(95%CI:21.60 - 27.29),P = 0.001。
      - 大学本科学历 的幸福指数评分比 研究生及以上学历 的低19.94(95%CI:17.10 - 22.79),P = 0.001。
      女性中:
      - 高中及以下学历 的幸福指数评分比 大学本科学历 没有显著性差异,P = 0.071;
      - 高中及以下学历 比 研究生及以上学历 的低19.10(95%CI:15.02 - 23.17),P = 0.001。
      - 大学本科学历 的幸福指数评分比 研究生及以上学历 的低15.30(95%CI:11.23 - 19.37),P = 0.001。

    参考链接:两因素方差分析-SPSS教程点击链接

    展开全文
  • 方差分析不管你是单因素还是因素,当各组的样本量都相等时,我们通常会忽略“方差齐性”这...比如单因素方差分析你有3个组,每组的样本容量都是20,则即使方差不齐也可以当成是方差齐进行F检验。另外即使各组样本...

    方差分析不管你是单因素还是多因素,当各组的样本量都相等时,我们通常会忽略“方差齐性”这个假设,也就是方差不齐也是可以的(警告:此条件在你使用方差分解法进行方差分析是有效的。如果你使用“线性回归”进行方差分析,如果方差不齐,则估计出来的回归系数方差不准确,会导致回归系数的检验出现偏差)。比如单因素方差分析你有3个组,每组的样本容量都是20,则即使方差不齐也可以当成是方差齐进行F检验。另外即使各组样本量和样本方差都有略微差别,我们也大可不必担心。一般来说,如果没有哪个样本的方差是其它样本方差4 倍以上(也就是说没有样本的标准差是其它样本的两倍以上),并且没有哪个样本的样本量是其它样本量的1.5 倍以上时, 你就可以用一般的方差分析程序以及使用略有一点误差的临界F 值表。如果样本量相差很大(井且样本量本身不是很大)并且样本的方差也很不相同,那么我们就有理由担心方差不齐的问题。总结来说就是当样本量都相等时,方差分析对于方差不齐是稳健的。这里我想说的是,至于有多稳健,只能看你的运气了。

    方差不齐,另一个办法是对数据进行变换,变换后也许方差齐。变换要注意一点的是有些变换是可以的,有些变换是不可以的。比如 对数变换,开根号变换都是可以的,为何?因为这两种变换不会改变数值的大小比较。30>20,必定有 ln30>ln20,30的平方根>20的平方根,变换前后不改变数值大小排序。但是“标准化”变换是不可以的,标准化后均值都为零,也就是变换后的均值都相等,这就改变了原始变量均值的大小排序。

    方差分析可以使用回归方法,也就是我们常说的“一般线性模型”(GLM)来分析。GLM其实就是“多重线性回归”。方差不齐对回归系数的影响主要是回归系数的标准误估计不准确,在大样本情况下,我们可以得到 “怀特异方差-稳健标准误”,基于这个“稳健标准误”我们就能对回归系数做正确的假设检验,也就是我们解决了异方差导致的问题。这个方法的缺点就是要求大样本。

    我个人比较推荐的是“自助法(bootstrap method)。自助法可以得到自助法回归系数,这个回归系数非常稳健,不管你有没有异方差都可以使用,当然,如果有异方差,这个自助法就显得更有威力了。SPSS 的 GLM 模块可以得到自助法回归系数。SPSS中多重比较也可以使用自助法。

    下面再说说单因素方差分析的额外方法。方差分析你可以做F检验,也可以直接进行多重比较。也就是方差分析并不是一定要做F检验。如果检测到方差不齐,可以使用方差不齐的“多重比较方法”,比如 Games-Howell Pairwise Comparison Test (GH) ,Tamhane’s T2 ,Dunnett’s T3 和 Dunnett’s C 就是方差不齐的多重比较方法。至于F检验,也有两种方差不齐的F检验方法:Brown-Forsythe 和 Welch 就是单因素方差分析方差不齐的F检验法。

    单因素方差分析还有一个非参数检验方法叫:Kruskal-Wallis检验法。这个方法不要求正态,也不要求你方差齐。

    上面方法到底怎么选择?我个人理解是,样本量相等对于方差不齐是稳健的,但是这个稳健到底有多稳健我们是不知道的,也许你的运气不够好它就不稳健了。所以如果你的样本量都相等,同时你有其它的解决异方差的方法,那么就使用其它的异方差解决方法,毕竟,其它的异方差方法的稳健是实实在在的。

    如果你有条件使用自助法,那么自助法应该是最优方法(排除数据变换法)。它的优点是对于各种苛刻条件它都很稳健,而其它的方法只在某些方面是稳健的,也就是其它方法不能面对各种条件都稳健。比如单因素方差分析,我们的选择非常多,但是只有“自助法”才是最优,其它方法都有各自的缺点,并不能包打天下。

    自助法和数据变换这两个方法,我认为都很好,并驾齐驱。如果通过数据变换能让方差齐,那么这两个方法你可以都使用,然后看看它们之间的差异,也许能给你带来其它更深层次的思考。

    展开全文
  • 多因素方差分析的自由度

    千次阅读 2021-04-22 06:35:27
    这样做不仅是为了节约经费(想想如果4个条件,每个条件找20人,就得给出80人的被试费!),另一方面也是尽量将个体差异进行控制,因为不管是EEG/ERP、还是fMRI,都是噪声富聚的信号,而且个体差异也是非常大的。图1 ...

    在脑科学中,通常采用重复测量的方式来开展研究。也就是设计不同的任务,让同一个被试都做一遍,来找出差异。这样做不仅是为了节约经费(想想如果4个条件,每个条件找20人,就得给出80人的被试费!),另一方面也是尽量将个体差异进行控制,因为不管是EEG/ERP、还是fMRI,都是噪声富聚的信号,而且个体差异也是非常大的。

    a4c26d1e5885305701be709a3d33442f.png

    图1 要点在于被试间和被试内进行分解

    当然,重复测量也有其弊端,如滞留效应,潜隐效应和学习效应,这里不展开来说。重复测量方差分析可以说是我们最常用到的工具。比如:要研究不同情绪图片,在回忆和再认任务中在各个电极上theta波的差异。那就是一个情绪(高兴、悲伤和中性)×任务(回忆、再认)×电极(4个电极)实验,即3因素方差分析。如果把被试分为两组,分别完成回忆和再认任务,这就更复杂了,成了混合设计的3因素方差分析。比较可悲的是,翻阅很多教科书,都重点讲单因素方差分析,或者是完全随机设计的方差分析。对我们常用的重复测量多因素方差分析,保持了集体的沉默。看了许多研究报告,发现同学们在写F(x,y)=???,

    P=???,通常把自由度x,y写错。这里我总结一下常用的实验设计如何确定自由度,希望对大家实践有帮助。

    (注意本讲义不包括因素无交互作用的情况,亦不包括自由度要矫正的情况!)

    分解要诀:方差分析多因素

    先看设计定思路

    重复与否是关键

    项目数定总自由度

    先把被试来数数

    定出被试间自由度

    混合设计要小心

    组间因素分解出

    被试内有自由度

    总减被试间可得出

    定下被试内因素

    误差自然不会误

    核心思想:把总自由度分解为被试间(between

    subject)自由度和被试内(within subject)自由度

    1

    重复测量单因素方差分析被试数:n 组内因素:a

    总自由度:an-1

    被试间自由度:n-1

    被试内自由度:n(a-1)

    *因素:a-1

    *因素×被试间:(n-1)(a-1)

    生成的结果:

    F(a-1,(n-1)(a-1))

    2

    重复测量2因素方差分析被试数:n 组内因素:a,b

    总自由度:abn-1

    被试间自由度:n-1

    被试内自由度:n(ab-1)

    *因素a:a-1

    *因素b:b-1

    *交互:(a-1)(b-1)

    *因素a×被试间:(n-1)(a-1)

    *因素b×被试间:(n-1)(a-1)

    *因素a×因素b×被试间:(n-1)(a-1)

    生成的结果:

    F(a-1,(n-1)(a-1))

    F(b-1,(n-1)(b-1))

    F((a-1)(b-1),(n-1)(a-1)(b-1))

    3

    混合设计(既有组间,又有组内的)2因素方差分析被试数:n 组间因素:a 组内因素:b

    总:abn-1

    被试间:an-1

    *组间因素:a-1

    *被试:a(n-1)

    被试内:an(b-1)

    *组内因素:b-1

    *组内×组间:(a-1)(b-1)

    *误差:a(b-1)(n-1)

    生成的结果:

    F(a-1,a(n-1))

    F(b-1,a(b-1)(n-1))

    4

    重复测量3因素方差分析,这在脑科学研究中非常常用!

    被试数:n 组内因素:a,b,c

    总:abcn-1

    被试间:n-1

    被试内:n(abc-1)

    *因素a:a-1

    *因素b:b-1

    *因素c:c-1

    *交互ab:(a-1)(b-1)

    *交互bc:(b-1)(c-1)

    *交互ac:(a-1)(c-1)

    *交互abc:(a-1)(b-1)(c-1)

    *因素a×被试间:(a-1)(n-1)

    *因素ab×被试间:(a-1)(b-1)(n-1)

    *因素abc×被试间:(a-1)(b-1)(c-1)(n-1)

    生成的结果:

    F(a-1,(a-1)(n-1))

    F(b-1,(b-1)(n-1))

    F((a-1)(b-1),(a-1)(b-1)(n-1))

    F((a-1)(b-1)(c-1),(a-1)(b-1)(c-1)(n-1))

    5

    混合设计(既有组间,又有组内的)3因素方差分析如果a因素处理的学习效应很强,无法采用方案4,通常采用方案5来避免学习效应,因此,本方案在脑科学研究中也很常用!

    被试数:n 组间因素:a 组内因素:b,c

    总:abcn-1

    被试间:an-1

    *组间因素a: a-1

    *被试:a(n-1)

    被试内自由度:an(bc-1)

    *组内因素b:b-1

    *组内因素c:c-1

    *交互ab:(a-1)(b-1)

    *交互bc:(b-1)(c-1)

    *交互ac:(a-1)(c-1)

    *交互abc:(a-1)(b-1)(c-1)

    *误差:a(bc-1)(n-1)

    生成的结果:

    F(a-1,a(n-1))

    F(b-1,a(bc-1)(n-1))

    6

    注意和完全随机设计的区别,举例如下:

    被试数:abn 组间因素:a,b

    如果把abn个被试随机分到a,b两个因素下,就构成了完全随机设计的2因素方差分析。

    分解顺序和重复测量也不同,没有被试间和被试内这一步,变成了直接进行处理间和处理内分解。

    总自由度:abn-1

    处理间:ab-1

    *因素a:a-1

    *因素b:b-1

    *交互ab:(a-1)(b-1)

    *处理内:ab(n-1)

    生成的结果:

    F(a-1,ab(n-1))

    F(b-1,ab(n-1))

    7

    如果把abcn个被试随机分到a,b,c三个因素下,就构成了完全随机设计的3因素方差分析。

    直接进行处理间和处理内分解。

    总:abcn-1

    处理间:abc-1

    *因素a:a-1

    *因素b:b-1

    *因素c:c-1

    *交互ab:(a-1)(b-1)

    *交互bc:(b-1)(c-1)

    *交互ac:(a-1)(c-1)

    *交互abc:(a-1)(b-1)(c-1)

    *处理内:abc(n-1)

    生成的结果:

    F(a-1,abc(n-1))

    F(b-1,abc(n-1))

    给出了以上自由度,我们来证明一个观点:“同样的实验因素和每个处理下的被试量,完全随机比混合设计自由度高,混合设计比重复测量自由度高”。取3因素方差分析为例:

    完全随机:a和b

    F(a-1,abc(n-1))

    F(b-1,abc(n-1))

    混合设计:组间a和组内b

    F(a-1,a(n-1))

    F(b-1,a(bc-1)(n-1))

    重复测量:a和b

    F(a-1,(a-1)(n-1))

    F(b-1,(b-1)(n-1))

    可以看到,对于a因素:abc(n-1)>a(n-1)>(a-1)(n-1);

    对于b因素:abc(n-1)>a(bc-1)(n-1)>(b-1)(n-1);

    所以上面的观点是成立的。还可以看到,对于混合设计:a(n-1)<=a(bc-1)(n-1),也就是在a=b时,组内条件比组间条件自由度大。

    练习题:

    为了验证自己有没有掌握,建议完成以下练习题:

    1.混合设计3因素方差分析被试数:n

    组间因素:a,b

    组内因素:c

    2.混合设计3因素方差分析考虑每组被试数不等的情况,a=2为被试间因素,被试数在每种处理下具体为:n1

    (a1条件) n2 (a2条件)

    组间因素:a

    组内因素:b, c

    3.重复测量5因素方差分析

    被试数:n

    组内因素:a,b,c,d,e

    你知道答案吗?

    下面是做anova的matlab命令,注意matlab软件自带的命令只提供完全随机设计方差分析,要做重复测量方差分析需要到mathworks官网下载

    1. 完全随机设计单因素方差分析

    anova1

    2. 完全随机设计两因素方差分析

    anova2

    3. 完全随机设计多因素方差分析

    anovan

    4. 重复测量单因素方差分析

    5. 重复测量两因素方差分析

    6. 重复测量三因素方差分析

    7. 混合设计两因素方差分析(既有组间,又有组内)

    点击命令可直接下载

    下面是实验数据统计分析的常规路线图

    a4c26d1e5885305701be709a3d33442f.png

    展开全文
  • 那么它和随机变量共同作用,必然使结果有显著的变化如果控制变量的不同水平对结果没有显著的影响,那么结果的变化主要由随机变量起作用,和控制变量关系不大1.2 方差分析的前提条件独立,各组数据相互独立,互不相关...

    a2994302-9511-eb11-8da9-e4434bdf6706.png

    一、方差分析简介

    1.1 方差分析基本思想

    通过分析研究不同变量的变异对总变异的贡献大小,确定控制变量对研究结果影响力的大小。

    • 如果控制变量的不同水平对结果产生了显著影响,那么它和随机变量共同作用,必然使结果有显著的变化
    • 如果控制变量的不同水平对结果没有显著的影响,那么结果的变化主要由随机变量起作用,和控制变量关系不大

    1.2 方差分析的前提条件

    1. 独立,各组数据相互独立,互不相关;
    2. 正态:即各组数据符合正态分布;
    3. 方差齐性:即各组方差相等。

    1.3 方差分析通常使用F统计量检验

    在spss中经常使用方差齐性检验(都是levene检验),

    • 一般情况下,只要sig值大于0.05就以认为方差齐性的假设成立,因此方差分析的结果应该值得信赖;
    • 如果sig值小于或等于0.05方差齐性的假设就值得怀疑,导致方差分析的结果也值得怀疑。

    SPSS会自动计算 F 统计值, F 服从 (k-1,n-k) 自由度的 F 分布(k 是水平数, n 为个案数), SPSS依据 F 分布表给出相应的相伴概率值。

    • 如果相伴概率值小于显著性水平(一般为0.05) ,则拒绝零假设,认为控制变量不同水下各总体均值有显著差异;
    • 反之,则认为控制变量不同水平下各总体均值没有显著差异。

    二、不同分析方法

    首先要理解实验的设计或模型的类型,选取正确的方法才能得出正确的结论

    2.1 单因素设计方差分析

    单因素方差分析测试某一个控制变量的不同水平是否给观察变量造成了显著差异和变动。

    2.2 随机区组设计方差分析

    又称配伍组设计。在进行统计分析时,将区组变异离均差平方和从完全随机设计的组内离均差平方和中分离出来,从而减小组内平方和(误差平方和),提高了统计检验效率。

    2.3 析因设计方差分析

    析因设计(Facorial design)是将两个或两个以上因素的各种水平进行排列组合、交叉分组的实验设计,是对影响因素的作用进行全面分析的设计方法,可以研究两个或者两个以上因素多个水平的效应,也可以研究各因素之间是否有交互作用并找到最佳组合。常见析因设计有: 2x2析因设计、IxJ两因素析因设计、IxJxK三因素析因设计。

    2.4 交叉设计方差分析

    交叉设计(cross-over design)是一种特殊的自身对照设计,它按事先设计好的实验次序,在各个时期对受试对象先后实施各种处理,以比较处理组间的差异。受试对象可以采用完全随机分为两组或分层随机化的方法来安排。

    2.5 拉丁方设计方差分析

    拉丁方设计(latin square design文库)是从横行和直列两个方向进行双重局部控制,使得横行和直列两向皆成单位组,是比随机单位组设计多一个单位组的设计。

    2.6 协方差分析

    协方差分析是将那些很难控制的因素作为协变量,在排除协变量影响的条件下,分析控制变量对观察变量的影响,从而更加准确地对控制因素进行评价。协方差分析要求协变量应是连续数值型,多个协变量间互相独立,且与控制变量之间也没有交互影响。单因素方差分析和多因素方差分析中的控制变量都是一些定性变量。而协方差分析中则包含了定性变量(控制变量),又包含了定量变量(协变量)。

    2.7 嵌套设计方差分析

    嵌套设计被称为巢式设计(nested design)有些教科书上称这类资料为组内又分亚组的分类资料。根据因素数的不同,套设计可分为二因素(二级)、三因素(三级)等设计。 将全部k个因素按主次排列,依次称为1级,2级 … k级因素,再将总离差平方和及自由度进行分解,其基本思想与一般方差分析相同。所不同的是分解法有明显的区别,它侧重于主要因素,并且,第i级因素的显著与否,是分别用第i级与第i+1级因素的均方为分子和分母来构造F统计量,并以F测验为其理论根据的。

    2.8 重复测量方差分析

    重复测量资料是由在不同时间点上对同一对象的同一观察指标进行多次测量所得,重复测量设计是在科研工作中常见的设计方法,常用来分析在不同时间点上该指标的差异。重复测量设计最主要的优点就是提高了处理组间的精确度,因为它可以通过对同一个体数据的分析估计出实验误差的大小。

    三、案例分析(后附源文件)

    3.1 析因设计方差分析

    举个例子,

    需求:分析A、B两种药物联合应用对红细胞增加数的影响,数据见表。

    根据数据表和需求,采用析因设计方差分析研究各因素之间是否有交互作用并找到最佳组合。

    a6994302-9511-eb11-8da9-e4434bdf6706.png

    操作步骤:

    aa994302-9511-eb11-8da9-e4434bdf6706.png

    ac994302-9511-eb11-8da9-e4434bdf6706.png

    b0994302-9511-eb11-8da9-e4434bdf6706.png

    b3994302-9511-eb11-8da9-e4434bdf6706.png

    !!!报告分析:

    b6994302-9511-eb11-8da9-e4434bdf6706.png
    此步骤形仅仅用于操作演示

    b9994302-9511-eb11-8da9-e4434bdf6706.png

    bb994302-9511-eb11-8da9-e4434bdf6706.png

    3.2 嵌套设计方差分析

    举个例子,

    需求:选取某种植物3个品种(Plant),在每一株内选取两片叶子(Leaf)(嵌套在植株因素下的第二个因素),用取样器从每一片叶子上选取同样面积的两个样本(两次重复),称取湿重,结果见表。对以上结果进行方差分析

    根据所选的数据符合嵌套设计方差分析方法(分为一级、二级...)

    be994302-9511-eb11-8da9-e4434bdf6706.png

    操作步骤:

    bf994302-9511-eb11-8da9-e4434bdf6706.png

    c5994302-9511-eb11-8da9-e4434bdf6706.png

    这一步骤非常重要!!!

    报告分析

    正确操作结果:

    c8994302-9511-eb11-8da9-e4434bdf6706.png

    错误操作结果:(没有进行相应的语法添加)

    ce994302-9511-eb11-8da9-e4434bdf6706.png

    3.3 重复测量方差分析

    举个例子,

    需求:某研究者欲了解一套新的锻炼方法的减肥效果,该研究者在某小学随机抽取了12名肥胖学生,随机分成两组!第一组每天下午按新的锻炼方法锻炼!第二组不参与新的锻炼,方法锻炼并于实验开始的第1、2、3个月分别测量学生体重减重情况,测量值如表

    根据数据特征(不同时间点对同一指标重复测量)采用重复测量方差分析

    cf994302-9511-eb11-8da9-e4434bdf6706.png

    操作步骤:

    d0994302-9511-eb11-8da9-e4434bdf6706.png

    d2994302-9511-eb11-8da9-e4434bdf6706.png

    d3994302-9511-eb11-8da9-e4434bdf6706.png

    !!!报告分析

    d4994302-9511-eb11-8da9-e4434bdf6706.png

    d6994302-9511-eb11-8da9-e4434bdf6706.png

    d8994302-9511-eb11-8da9-e4434bdf6706.png

    d9994302-9511-eb11-8da9-e4434bdf6706.png

    拓展:当测量时间不是等间距时:

    db994302-9511-eb11-8da9-e4434bdf6706.png

    点击获取

    案例数据​pan.baidu.com

    待更新...

    展开全文
  • SPSS(二)SPSS实现多因素方差分析模型 单因素方差分析上一篇博客https://blog.csdn.net/LuYi_WeiLin/article/details/89917656已经介绍完毕 这篇博客我们主要来学习多因素方差分析 多因素方差分析,就是同时考虑...
  • 试验为: - 对照组:清水 - 实验组: 某肥料四个浓度梯度,分别是A,B,C,D,施肥一段时间之后测量树高(要控制其他变量保持一致,比如施肥之前的树高要基本保持一致,生长势基本保持一致等等)做方差分析的时候数据...
  • 来源:...这样做不仅是为了节约经费(想想如果4个条件,每个条件找20人,就得给出80人的被试费!),另一方面也是尽量将个体差异进行控制,因为不管是EEG/ERP、还是fMRI,都是噪声富聚的信号,而...
  • 方差分析有很种,就单因素而言,方差分析也分为单因素方差分析和单因素重复测量方差分析。那我们在做分析的时候是选择单因素还是重复测量方差分析了? 我们是根据实验设计来决定采用什么样的分析方法。实验设计是...
  • Graphpad做单因素方差分析步骤详解

    千次阅读 2021-01-12 22:54:28
    方差分析就是对试验数据进行分析,检验方差相等的个正态总体均值是否相等,进而判断各因素对试验指标的影响是否显著,根据影响试验指标条件的个数可以区分为单因素方差分析、双因素方差分析多因素方差分析。...
  • 因素方差分析 1. 双因素方差分析的理论 2. 双因素方差分析的实现
  • matlab双因素方差分析

    2021-04-24 23:20:36
    在MATLAB中求解 源程序 a=[76,67,81,56,51; 82,69,96,59,70; 68,59,...... MATLAB 进行单因素方差分析—ANOVA 方差分析的目的是确定因素的不同处理(方法、变量)下,响应变量(类别、 ......本节主...
  • 因素方差分析和单因素方差分析

    千次阅读 2018-04-12 15:29:00
    因素方差分析(Double factor variance analysis) 有两种类型:一个是无交互作用的双因素方差分析,它假定因素A和因素B的效应之间是相互独立的,不存在相互关系;另一个是有交互作用的双因素方差分析,它假定因素A...
  • 因素方差分析

    千次阅读 2019-05-30 23:40:20
    基本分析转数据后直接点确定: 方差齐性(同质性)检验: 即检验自变量对总体方差的影响 原假设是方差相同: 0.491>0.05方差相等 p=0说明自变量对因变量影响显著 https://blog.csdn.net/qq_41228218/articl...
  • 现在老板想考察不同机型以及不同操作工人对产品的影响,为此他简单设计了一个小实验,让甲、乙、丙、丁四个工人操作机器Ⅰ、Ⅱ、Ⅲ各三天,其产品产量如下表所示,试分析工人和机器对产品产量是否有显著影响?...
  • 在试验中,把考察的指标称为试验指标,影响试验指标的条件称为因素因素可分为两类,一类是...方差分析(Analysis of Variance,简称ANOVA)主要用于验证两组样本,或者两组以上的样本均值是否有显著性差异(是否一致...
  • 根据影响试验指标条件的个数可以区分为单因素方差分析、双因素方差分析多因素方差分析。单因素方差分析(one-wayANOVA)又称完全随机设计,是一种将实验对象随机分配到不同处理组的单因素设计方法。今天先给大家介绍...
  • MATLAB单因素方差分析MATLAB:单因素方差分析重复数相同的方差分析当在因素 的每一水平下重复试验次数相同,即当m  m   m 时,上A1 2 r述一些表达式可以简化。若记每一水平下重复次数为 ,则效应约束条件可...
  • 使用R语言进行单因素方差分析

    千次阅读 2021-01-17 15:07:28
    1、方差分析的基本概念方差分析(Analysis of Variance, ANOVA),由英国...方差分析能够解决个均值是否相等的检验问题。方差分析是要检验各个水平的均值是否相等,采用的方法是比较各水平的方差。如研究不同的销售点...
  • 方差分析就是对试验数据进行分析,检验方差相等的个正态总体均值是否相等,进而判断各因素对试验指标的影响是否显著,根据影响试验指标条件的个数可以区分为单因素方差分析、双因素方差分析多因素方差分析。...
  • 检验方差相等的个正态总体均值是否相等,进而判断各因素对试验指标的影响是否显著,根据影响试验指标条件的个数可以区分为单因素方差分析、双因素方差分析多因素方差分析。试验中要考察的指标称为 试验指标,...
  • 青年智囊SPSS双因素重复测量方差分析简洁版上期我们分享了卡方检验的案例,很小伙伴私信我们给了我们很好的反馈,感谢大家的支持!还有几位小伙伴希望我们能出一期SPSS重复测量方差分析的教程,应大家的要求,这期...
  • 通俗易懂说单因素方差分析

    万次阅读 多人点赞 2019-01-22 12:24:36
    因素方差分析 由单因素方差分析的名字,我们可以知道单因素指的是一个因素,即一个自变量,一个因变量,采用方差的方式进行分析。单因素方差表的核心内容是利用组间的离差平方和比上组内离差平方和。(注:离差...
  • 方差分析就是对试验数据进行分析,检验方差相等的个正态总体均值是否相等,进而判断各因素对试验指标的影响是否显著,根据影响试验指标条件的个数可以区分为单因素方差分析、双因素方差分析多因素方差分析。...
  • SPSS实战:单因素方差分析(ANOVA)

    万次阅读 多人点赞 2020-06-08 20:44:18
    SPSS:单因素方差分析方差分析因素方差分析因素方差分析的原理单因素方差分析的SPSS操作 方差分析 方差分析是一种假设检验,它把观测总变异的平方和与自由度分解为对应不同变异来源的平方和与自由度,将某种控制...
  • R-单因素方差分析

    2018-11-02 11:54:32
    因素(factor):通常把影响试验考察指标的条件或要素称为因素,可以是单因素,也可以是多因素。如高三学生的性别;研究养殖日增重量时,品种、饲料、投喂方法等等就是其影响因素。 •水平(level):每一个因素根据...
  • 方差分析就是对试验数据进行分析,检验方差相等的个正态总体均值是否相等,进而判断各因素对试验指标的影响是否显著,根据影响试验指标条件的个数可以区分为单因素方差分析、双因素方差分析多因素方差分析。...
  • 一、方差分析是什么? 方差分析(analysis of variance,ANOVA)是分析各类别变量(如区位)对数值变量(如销售额)的影响的一种统计方法。 二、方差分析的原理是什么? 方差分析是通过分析数据误差来检验类别...
  • 因素方差分析

    2021-08-26 21:27:08
    回顾上一篇单因素方差分析的一个例子: matlab代码: clc, clear,close all a=readmatrix('data14_2.txt') [p.tst]=anova1(a) 因为,所以这几种工艺制成的灯泡寿命有显著差异。 箱线图如图所示: ...
  • 在研究中,要证明某因素对某指标是否有显著影响,比如研究不同乙醇浓度对杀灭细菌数量的影响,就要用到单因素方差分析,而利用SPSS软件来分析数据则非常方便 1.输入数据 第一列为因子,第二列为因变量 2.进行单因素...
  • R语言单因素方差分析(附代码)

    千次阅读 2021-03-24 10:08:30
    因素方差分析 概念不给大家赘述了,可自行查阅相关书籍。 直接上题目: 题目 pseudomonas aeruginosa菌在样本A中的丰度为:0.014,0.015,0.017;在样本B中的丰度为:0.011,0.012,0.013。确定该菌株在样本A、B中...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 31,358
精华内容 12,543
关键字:

多因素方差分析的条件