精华内容
下载资源
问答
  • 科学研究设计五:实验设计

    千次阅读 2017-11-18 08:41:43
    如何做科学研究的实验设计

    说明

    这是Bangor University 2007年School of Sport Health & Exercise Sciences的教学讲义,大家可以在这里查看原课程的讲义

    课程目录

    为什么要看这个?

    这个在我看来,适合大学生或者刚入学的研究生学习,主要为了提高科学素养、培养科学研究的思维以及一些研究设计中要考虑的很多细节问题。虽然里面没有很多高超的方法,而且课程也是十年前的,但是里面对于科学的理解以及思考问题的思维方式确实值得刚进入科研这条不归路的人学习。

    格式说明

    1. 标题格式都按照markdown排版的,但是标题之间的关系可能没有排好,主要是参考了原课程网站的标题设计
    2. 书中一些专有名词或者大牛们说的话都没有翻译,以防止因为我的问题导致误解
    3. 名人名言和我自己的理解都是用引言格式标注的,不同的是,大牛们的话是英文,我自己的理解是中文
    4. 因为课程中有问答环节,问题我会用加粗来标识,问题的答案一般会用斜体来标识

    最后一句话

    因为本人英文水平有限,有些话翻译得可能很别扭,有能力的话建议大家去看原网址。

    这里写图片描述

    实验是什么 What is an experiment?

    “实验”这个术语经常被用来描述包括收集数据的任何情况。我经常听到学生,甚至更有经验的研究人员,把各种不同的研究情况描述为“实验性”,而事实上他们不应该这样做。例如,研究人员可以使用一组参与者的两种新型有氧健康测试来收集生理数据,然后将这两个时间点的得分关联起来,以确定新程序的重测信度。这不是一个实验。再举一个例子。假设你想从一些不同的动机测量来预测对锻炼计划的依从性。您可以让参与者在计划开始时完成对动机变量的问卷调查,然后使用回归分析来确定其对日后遵守计划的影响。这也不是一个实验。本课将告诉你为什么。

    设计与分析 Design and analysis

    从一开始就认识到,虽然在你的学位课程的第二年,我们分别教授研究设计和统计,但实际上它们是同一枚硬币的两面。 即使设计良好的研究,您也需要分析数据以确定任何变化、差异或关系在统计上是否显着。 相反,世界上所有的统计都不能帮助你从一个设计不好的研究中得出有效的结论。 在规划和设计一项研究时,要牢记如何分析获得的数据是至关重要的。 我忘记了最后一年的项目学生来帮我分析他们的数据的次数,只是失望地发现他们不能回答他们打算的问题,因为这个研究没有被正确设计。 设计和分析之间的关系也将在本课中进行说明。

    因果关系 Causation

    首先,我们来考虑一下实验的目的。回想一下关于科学本质的前一课。我们在那里了解到,科学的一个主要目标(许多人会认为最终的目标)是确定什么导致了什么。如果我们知道什么原因会发生,那么我们可以介入(或者不会发生,如果这是我们想要的)。例如,如果我们知道什么原因导致肌肉浪费在类风湿关节炎患者身上,我们可以进行干预来预防它;如果我们知道什么原因导致运动员对竞争情况更有信心,我们可以实施一个培训计划来帮助他们保持信心,等等。

    所以我们要做的就是评估这个简单的命题:If X, then Y

    换句话说,如果给予这个治疗(X),那么这个结果(Y)应该发生。然而,只通过实施治疗之后的结果变化是不足以证明X实际上导致Y的。除治疗外,可能还有许多其他原因导致Y的变化。假设我们想知道一个心理训练计划是否导致运动员竞争状态焦虑的减少。我们派出一批运动员参加该项目,并在训练期间和之后的比赛中评估他们的焦虑情绪。我们观察到的任何焦虑减轻可能是由于其他因素造成的。参与者可能只是习惯于通过在培训期间参加的活动中获得的经验来应对竞争压力。

    为了确定它确实是X导致Y而不是别的,我们必须同时测试两个命题:

    If X, then Y 和 If not X, then not Y

    因此,如果我们有两组运动员,其中一组接受了心理训练,另一组则没有,我们发现只有训练组的成员表现出焦虑减少(或者比没有治疗组减少更多)那么我们可以得出这样的结论,那就是这个计划导致了这些结果上的差异。这样可以吗?假设我们的心理训练组的运动员在训练期间有很多比赛,而没有处理的运动员只有几个。这可能仍然是比赛的经验,导致焦虑减少,而不是培训计划。或者,假设我们已经将更多的经验丰富的运动员分配给了训练组,而没有经验的运动员分配给了未处理组。开始的时候,更有经验的运动员可能已经具备了更多的精神技能,并且不太担心竞争事件。因此,为了得出治疗(X)导致结果(Y)的结论,我们还必须确保在该项目过程之前或过程中对Y的操作没有其他影响。我们必须把X的影响与其他潜在的影响分离开来。

    那么,我们如何确定X实际上导致了Y?那么,为了确定因果关系,必须满足三个条件。我把这三个步骤称为因果关系:

    这里写图片描述

    第一步是证明因果关系的一个必要但不充分的条件。 如果X导致Y那么显然他们必须是相关的。 如果吸烟导致癌症,那么吸烟必须与癌症有关。 但是,仅仅因为两件事情是相关的,所以并不意味着一件事导致另一件事。 你应该已经在统计中遇到了这个想法。 统计上,我们可以通过关联来确定两件事是否相关。 但是,相关性本身不能确定因果关系。 如果X和Y是相关的,那么X可能会导致Y,但是同样的,Y可能导致X.或者,X和Y只是相互关联的,因为它们都是由别的东西(Z)引起的。 这被称为虚假关联(spurious correlation):

    这里写图片描述

    例如,鞋子大小(X)和语言技能(Y)在儿童中高度相关。 这并不意味着大脚会导致孩子更熟练。 两者都是由相同的因素造成的,我们可以称之为成熟(Z)。

    第二步也是证明因果关系的一个必要但不充分的条件。在我们对宇宙的正常经验中,我们并不期望效应在其原因之前出现。如果我们发现X在时间Y之前,至少我们可以排除Y引起X的另一种假设。所以虽然这个步骤不能确定因果关系,但它确实使我们更接近于确定X引起Y.为此在两个时间点收集数据的纵向设计的原因通常比横截面设计更强,在这种设计中,所有数据都是在同一时间点收集的。

    因果关系的最后一步涉及实验。我们操纵(或改变)X,以便看看我们是否在Y中得到了一个改变。通过你的统计训练,你将知道在这种情况下,X被称为自变量,Y被称为因变量(因为值Y的水平取决于X的水平)。

    实验操作 Experimental manipulation

    术语“实验”可以定义如下:

    An experiment is a study in which at least one variable is manipulated and units are randomly assigned to the different levels of the manipulated variable(s). Pedhazur & Schmelkin (1991)

    从这个定义中,我们可以看到有两个重要的条件必须满足,才能把研究称为实验。 第一个条件是我们必须操纵至少一个独立变量来创建不同的情境。 正如在上面的心理训练例子中,我们可以给参与者分配两个条件之一:一个接受该程序的治疗组和一个没有接受该程序的无治疗(控制)组。 因此,独立变量(治疗)通过创建两个情境来操纵:接受治疗而不接受治疗。

    随机分配 Random assignment

    其次,我们必须确保这些群组之间没有系统的差异,否则可能导致治疗的结果发生变化。 换言之,我们希望这两个群体对于结果的任何影响,除了他们是否接受治疗之外,都是等同的。 通过这样做,我们可以将治疗的效果与其他任何潜在的影响结果隔离开来。 这样的其他影响被称为潜在的独立变量,因为它们是可能导致结果变化的因素。 这种“滋扰”变量的另一个术语是混淆变量( confounding variables),因为它们混淆了研究中的结论。

    我们通常通过随机分配参与者(上述定义中的 units)到不同的治疗条件(自变量)来实现组的等价。 我们的运动员样本必然会在很多方面发生变化:一些运动员会比其他运动员更有经验,有些运动员会参加更多的比赛,自然而然地不易焦虑,更聪明,有更好的辅导支持等等。 所有这些因素都可能影响结果。 通过随机分配运动员到两组,我们可以确保他们在这些因素方面上基本等同。

    请注意,我只是说“基本等同”。事实上,随机分配到不同组的两个(或更多)个人组在所有方面不可能都是完全相同的。当随机分配时,我们依赖于由于概率规律的假设,个体之间的任何差异将是均匀的。因此,通过随机分配获得的组被称为概率等价(probabilistically equivalent)。换句话说,他们在概率上是相似的。团队的相似和随机化过程相当。当然,在小样本情况下,这可能是纯粹偶然的,两组之间有区别的可能性更大。因此,只要有可能,使用随机化来分配组是一个好主意。你可以通过测量这些变量来进行测试,然后测试一下这些组是否与它们有显着不同。例如,假设年龄在一项研究中可能是一个混杂的变量。你可以很容易地检查研究组的平均年龄有没有显着差异。

    然后,操纵自变量和随机分配组是实验的关键特征。 没有这两个特征的研究都不是一个实验。 在本课第一段给出的例子中,没有操作变量,也没有随机分配给组。 这就是为什么这些研究不是实验。

    一个真正的实验涉及操纵自变量,同时保持所有其他潜在的自变量不变,并随机分配到自变量的不同组。

    任何其他类型的研究不是一个实验!

    回想一下之前的抽样课程,我们需要区分随机分配到组和样本的随机选择。 对群体进行随机化并不意味着你有一个代表你感兴趣的人群的样本。为了对群体做出有效的推断,你仍然需要获得一个有代表性的样本。

    准实验 Quasi-experiments

    虽然真正的实验是确定因果关系的标准方法,但不幸的是,直接操纵自变量或随机分配参与者到不同的群组并不总是可能的。 没有人进行真正的实验来证明吸烟会导致人类癌症。 原因很明显, 你不能随意指定人吸烟二十年,然后看看你的吸烟组是否有较高的癌症发病率。 同样,人的一些属性是固定的,不能被操纵。 如果我们对性别对某些结果的影响,我们不能随意分配个人为男性或女性。

    这并不意味着我们不能解决这些问题。 我们仍然可以通过使用所谓的准实验设计来将真实实验的原理应用于这些情况:

    A quasi-experiment has all the elements of an experiment, except that subjects are not randomly assigned to groups. Pedhazur & Schmelkin (1991)

    在一个准实验中,自变量不是由调查者直接操纵的。 相反,自变量在某种程度上是自然发生的,或者已经通过一些超出研究者控制的过程而发生了变化。 例如,假设我们研究不同性别的肌肉损伤的差异。 尽管我们不能随机分配男性和女性的参与者,但我们仍然可以比较男性和女性对肌肉损伤的反应。 这被称为非等组设计,并且被广泛使用。 这个设计的主要问题在于,由于这些群体是非等价的,除了自变量之外,它们在很多方面都会有所不同。 因此,在因变量中观察到的任何差异都可能是由于这些其他潜在的自变量。 我们可以尽量减少,但不能完全消除此问题。

    另一个常见的准实验设计被称为断点回归(regression-discontinuity) 设计,或者更简单地说是截断设计。这涉及根据他们在预处理变量上的分数给参与者分组。例如,您可能想要比较治疗对个体焦虑高或低的影响。您首先要测量他们的特质焦虑,然后根据预定的截止点将参与者分配到高和低组。通常使用中值分割程序。首先计算截止变量上总样本的中位数。然后,将所有那些得分低于中位数的参与者分配给“低”组,将那些得分高于中位数的得分分配给“高”组。问题在于,如果分数正常分布(应该是这样),大多数人都会在中位数附近得分。所以,你只是把那些刚刚高于中值“高”的那些和那些刚刚低于中值“低”的那些称作实际上相当平均的那些。另一种方法是采取更多的极端截断,分数分布的顶部和底部三分之一,并从研究中消除中间的分数。那么问题是,你必须丢弃大量的数据,你会收集相当大的麻烦。

    对于断点回归,这里有个讲解更透彻的例子:如果我们想知道上“一本”是否对学生未来工资有影响,使用RD方法,就是观察那些在一本线上下2分的学生,看“上一本”和“没上一本”的学生的未来工资差异。这个想法的天才之处在于,高考的上下5分,实在是一件随机性非常大的事情。让这批学生重新考一次,不少学生的情况可能就要逆转。对于这5分区间内的学生来说,一条一本线,就像一个天然的分割线,将两组人随机分开了。

    设计符号 Design notation

    坎贝尔和斯坦利(Campbell and Stanley,1963)引入了一个简单的符号系统来描述不同类型的设计,我们将在下一节中使用。

    观察 Observations

    观察或测量由O表示。下标用于表示特定的测量时机(例如O1,O2)

    操纵变量 Treatments

    自变量(治疗,操作,干预,训练程序或任何你要操纵的事情)都由X表示。在同一研究中的不同治疗由下标表示(例如X1, X2)。 一个没有治疗的条件空白表所示。

    群组 Groups

    不同小组在不同的行。 连续的X和O适用于同一组。 例如,有两组,将会有两行。

    分配组 Assignment to groups

    随机分配由R表示。非等价组由N表示;;截止分配的组由C表示

    时间 Time

    从左到右的维度表示时间顺序。 例如,O1 X O2表示观察,治疗,然后是第二次观察。

    设计类型 Types of design

    基本上有三类设计:实验,准实验和预实验(有时称为非实验)。 以下决策树可以帮助您确定在研究中使用哪种类型的设计:

    这里写图片描述

    现在我们来看看这些不同设计分类的一些具体例子。 这些设计代表了基本应用; 他们有更复杂的变化。 我们将在下一课中继续研究主要设计的具体优缺点。

    预实验设计 Pre-experimental designs

    1. 案例研究 One shot case study (posttest only design)

    所有的最简单的设计,案例研究可以用我们的符号系统来描述:

    XO

    我们只有一组参与者,给他们一个治疗(操纵自变量),然后测量其(所谓的)效果。 例如,我们可能会给一些群体增加体力活动的动机,然后衡量他们的锻炼量。 这种设计在证明治疗的因果效应方面的弱点应该是显而易见的。 由于我们没有衡量参与者在治疗前做了多少锻炼,我们怎么能说出治疗是否导致了改变? 而且,如果他们没有接受治疗,我们不知道他们可能做了多少活动。

    这并不是说这样的设计毫无用处。 假设你对英格兰退出世界杯决赛对人们情绪状态的影响感兴趣。 事件发生后,通过访问个人可以获得有关人们情绪的有用信息。 但是你不能从数据中得出任何的因果影响。 你不能确定这是英格兰退出,而不是其他因素,决定了样本的情绪状态。

    2.单组,前测,后测 Single group, pretest, posttest design

    O1XO2

    有了这个设计,我们可以确定治疗和因变量一起变化。 但是,我们仍然不知道是不是治疗导致了变化,为什么不是其他因素,因为我们不知道没有治疗,效果是否会改变。 在这里,我们正在测试最早提出命题,如果X那么Y,而不是另一半:如果不是X,那么不是Y。

    3. 静态组比较 Static group comparison

    NXO1NXO2

    这是一个没有重复措施的准实验,非等价组设计的例子。 经历过治疗(或事件)的组与未接受治疗的组相比较。 例如,在英格兰退出世界杯之后,我们可以将对足球感兴趣的人的情绪状态与对足球不感兴趣的人的情况进行比较,推断这种情况只会影响喜欢足球的人的情绪。 但是,如果没有预先测试,我们无法知道在没有发生事件(或治疗)的情况下他们是否会有所不同。

    真正的实验设计 True experimental designs

    4.随机前测 - 后测对照组设计 The randomised pretest-posttest control group design

    RO1XO2RO3XO4

    也常被称为随机控制试验(RCT:randomised controlled trial),特别是在医学研究中,这是原型实验设计。因此,我们将花费大量的时间来了解它和它的一些变化。在其基本应用中,参与者被随机分配到治疗或对照条件,并且在基线(即在治疗实验组之前)和之后处理两组中测量因变量。通过这个设计,我们可以确定我们的基本命题的两个方面:如果X,那么Y,如果不是X,那么不是Y.它的优点在于我们可以:

    (a)确定这些组在基线是否相等(至少就测量的因变量而言)。

    (b)确定是否是治疗导致实验组的变化,而未应用治疗时的对照组未观察到的因变量的变化,或治疗导致因变量的变化比没有治疗的变化更大。

    这个设计有很多变型。 例如,您可以进行进一步的后续观察,以便日后可以看到在治疗后因变量的任何变化:

    RO1XO2O3RO4O5O6

    除了控制条件外,您还可以有两个以上的实验条件或组。 例如,您可能想要比较两种不同类型的有氧训练计划的效果,或比较强化的训练计划与不密集的计划的效果:

    RO1X1O2RO3X2O4RO5O6

    此外,前测后测设计通常作为准实验设计应用,没有随机分配条件。 例如,可以通过比较男性和女性,经验多少d的运动员,或根据某些标准的高分和低分创建小组。 在这种情况下,很明显,我们就会遇到非对称的问题。 我们将在下一课中更深入地讨论这个问题的后果。

    5.后测只控制组设计 The posttest only control group design

    在这个设计中,参与者被随机分配到组,但都没有得到预先测试:

    RXO1RO2

    在这里,我们假设随机化在预测试中将这些组等同起来。 设计看起来可能比以前更弱,但事实上它有两个明显的优势。 一方面,实施成本更低,耗时更少,因为只有一半数据需要收集。 它还具有设计优势,我们将在下一课中进行讨论。 当然,这个缺点是我们没有检查这些组在预测试中因变量是否一样。

    6.所罗门四组设计 The Solomon four group design

    这种设计是以前设计的组合:

    RO1XO2RO3O4RXO5RO6

    所有的小组都进行了测试。 一组进行前测并得到治疗;;一组进行了前测,但没有得到治疗; 一组不进行前测并得到治疗;一组未经前测,未得到治疗。 这个设计结合了所有的可能,因为它既保留了以前设计的优点,又没有缺点(在下一课中更多地介绍了这一点)。 然而,从实际的角度来看,实施成本高,费时,需要更多的参与者。

    结果和分析 Outcomes and analysis

    现在来看看实施基本的随机前测后测控制组设计的可能结果以及设计如何与数据分析相关。 为了使这个更具体,让我们假设我们正在研究一个有氧运动项目对自尊的影响。 我们随机分配参加者治疗(每周两次,一小时的有氧运动三个月)或没有治疗控制条件,并测量他们在基线(前测)和培训后(后测)的自尊。 自变量是组(有两个层次:治疗和控制)和测试(有两个层次:前和后测)。 因变量是自尊。 我们可以像这样描绘设计:

    这里写图片描述

    正如你所看到的,方框中的每个单元格代表一个观察或测量,每个组的前后测。我们需要确定三件事情:

    1.这些组在前测时是否一样(治疗之前的自尊组之间没有差异)?这是测试O1与O3。

    2.其中一个或两个小组随着时间的推移而变化吗? (O1对O2和O3对O4)。

    3.后测组是否有所不同? (O2对O4)。

    如果我们假设治疗会增强自尊,那么我们希望看到:

    1.训练前两组之间没有差异。

    2.治疗组改善但对照组不改善或治疗组改善程度高于对照组。

    3.治疗组在测试后分数高于对照组。

    分析数据。选择的分析可能是方差分析。具体而言,我们将进行双因素方差分析,重复测试。 ANOVA实际上并不是分析这个设计数据的唯一方法,但它是您熟悉的方式,所以我们会坚持下去。该设计可以被描述为混合模型ANOVA。混合模式,因为它包括主体效应(参与者之间的时间差异)和主体效应(参与者在前后测试之间的差异)。

    1. 没有结果 The null outcome

    第一个可能的结果是没有任何反应。这两个群体的自尊评分都没有变化。当以图形方式显示时,结果如下所示:

    这里写图片描述

    显然,治疗没有效果,方差分析不会产生显着影响。

    2. 时间是主要影响 Main effect for time (within subjects)

    两个群体的结果以同样的速率提高。这里的治疗对改变本来就没有影响。请注意,改变的方向可能是相反的:两组的自尊可能随着时间的推移而降低。这仍然是一个时间的主要影响。

    这里写图片描述

    3. 群组的主要影响 Main effect for group (between subjects)

    实验组在前测和后测中均高于对照组,但两组均未随时间变化。 这表明:(a)随机分配不起作用(自尊水平不是随机分布在两组之间);(b)治疗没有效果。

    这里写图片描述

    人们不得不质疑为什么随机分配不起作用。 在实验组中,可能纯粹是一种自尊心较高的个体出现的机会。 或者,实验组中的一个或两个个体在前测试中得分特别高,并且这些分数影响了组的平均值(或者对照组中的一些个体具有特别低的分数)。 这样的个人被称为离群值。 在进行分析之前,您可以筛选异常值,如果发现任何异常值,则从数据集中消除它们是合理的。 例如,您可以消除所有样本平均值以上三个或更多标准偏差的情况。

    4.时间和群组的共同影响 Main effects for both time and group

    这两个因素都有可能产生主要的影响。在这里,这些组在前期和后期测验中都有显着差异(再次表明随机化不起作用),并且随着时间的推移,两组都有显着的改善(表明治疗没有超过本来会发生的效果)。这个变化可能是在另一个方向。

    这里写图片描述

    5.X组测试交互 Group X test interaction

    当然,我们真正想要的只是在治疗组自尊方面有所改善,或者治疗组的改善比对照组有更大的改善。 这样的结果看起来像这样:

    这里写图片描述

    显然,图表显示,这些组在前测中没有差异,对照组的自尊水平没有变化,但治疗组的自尊水平有所提高,这导致了后测组之间的差异。

    我们现在可以肯定地说,治疗是有效的吗?那么,好像还不能确定。这取决于排除观察到的变化(潜在的自变量)的任何其他潜在的解释。这是我们将在下一课中处理的事情。同时,你能想出这些发现的任何其他解释吗?

    交互可以采取多种不同的形式。例如,一个普遍的发现是两组都改变了,但治疗组的改变比对照组更多。如果我们能排除潜在的混乱,我们可以说,治疗的效果超过了没有治疗就会发生的事情。我们将在本课的后面看看另一种特殊的交互形式。不管他们采取什么样的形式,但是当你画出结果的时候,你知道你有一个互动,就像我们在这里做的那样,线条不平行。请注意,在主效果图中,线条总是平行的,无论它们的整体形状如何。考虑到我们现在的例子,想一想你可以找到多少种不同的交互形式,以及你如何解释它们。

    Fully within subjects designs

    到目前为止,我们一直在研究混合模型设计,参与者被分配到不同的治疗组。 有时我们想要评估几种不同的治疗方法或不同的治疗效果。 例如,在一项运动控制研究中,我们可能想要确定不同反馈量对技能表现的影响。 我们可以将参与者分配到不同的小组,每个小组接受不同的反馈,使用随机前测后测设计。 然而,更有效的方法是让同一组参与者进行各种治疗。 这消除了组间变异所产生的任何“噪音”,使得我们更有可能在那里找到效果。 这样的设计有时也被称为完全重复的措施设计(fully repeated measures designs)。 在设计符号中,有两种治疗的研究可能如下所示:

    RX1O1X2O2

    这种设计的一个问题是第一次治疗的效果可能会影响第二次治疗的反应。 这被称为顺序效应(order effect)。 这可以通过抵消来防止:一半的参与者先做X1再做X2,而另一半先做X2再做X1。

    这里有一个这样的研究的例子。 假设我们研究复杂任务的即时或延迟影响。 我们让参与者用即时KR( knowledge of results)执行任务,观察它们,然后让它们再次执行延迟KR并再次观察它们:

    这里写图片描述

    KR类型的呈现顺序是平衡的。这是一个单一的因素的设计,并将通过重复测量单因素ANOVA分析。

    双因素的例子 A two factor example

    设计可能比这更复杂,并且有许多不同的因素。 假设,立即与延迟的KR的影响不同,取决于参与者是否处于压力的情况。 这里我们有两个因素:KR的类型和压力与没有压力。 具体而言,我们假设,当参与者受到压力时,在延迟KR下,表现会更好,但在没有压力的情况下,在即时KR下更好。 我不知道这个假设有什么好的理由,但是,嘿,这只是一个例子!

    因此,我们让参与者在高低压力条件下以延迟和即时KR进行表演。 再次,我们平衡,以避免秩序的影响。 我们可以像这样描绘设计:

    这里写图片描述

    如果我们的假设是正确的,绘制结果如下图所示:

    这里写图片描述

    你可以看到,当在低压力条件下立即给予KR表现比在高压下更好。 相反,当给定延迟KR时,在高压力条件下性能更好。 有显着的KR类型与压力的相互作用。 这种交互形式被称为交叉交互(crossover interaction)。

    结论 Conclusion

    我们现在讨论因果关系,我们已经涵盖了一系列的基本设计和设计原则,并且展示了最常见的设计如何与数据分析相关。 不过,这其实只是故事的一半。 我们仍然必须考虑如何排除一些潜在的独立变量或混杂变量影响实验结果的可能性。 我们还没有考虑究竟为什么或如何正确实施实验设计,使我们能够归因于因果关系。 这些是关于研究的有效性的问题,我们将在下一课中讨论。

    展开全文
  • 对3因素混合水平[3,3,4]和有交互作用,采用18次试验的方案,D-optimal的试验设计表格如下: warning off; sortrows(rowexch(3,18,'interaction','categorical',1:3,'levels',[3,3,4],'tries',1000,'maxiter',50)) 方差...

    本来是转发代码的,后来发现问类似问题的人太多了,干脆根据自己的感想,总结成一篇原创吧。


    快速入门的方法,软件推荐

    希望不要再来问我了。——建议自己先去学一款适用于DOE的软件,同学们!(我自己也是主要靠软件、而不是靠学习统计原理来做事的)


    这些软件如下:

    1. Minitab, 大部分搞six sigma, lean,DMAIC/DFSS的公司采购的都是这个软件;(流行,但不见得强大,公司用户的统计知识水平可想而知)

    2. Statistica , 比Minitab更强大、使用方法也相似(不知道跟minitab之间是谁学了谁),以前说四大数学软件,我一直误以为是matlab,mathematica,maple和statistica

    3. SAS JMP 这SAS应该大名鼎鼎了;该公司还开发了专门搞试验设计的JMP, 以前使用过,感觉:强大,DOE的话,估计比minitab强;

    4. Design Expert, 我没有用过,但是,下面一本英文书里推荐的三款软件之一就是它(JMP, Minitab),小巧强大;

    5. unscramber也是我在网络上看过的一款类似软件,没有用过,说实话,一款软件强大的足矣了,用不着每种都学:想起那个典故: 上衣口袋别一支钢笔,是中学生,两只是大学生,别三支以上钢笔……是修钢笔的。


    这些软件大多有文档和帮助,网络上也有案例,建议全程学习一两个案例之后,搞懂了再深入琢磨。有一个全局的掌控之后才明白哪里该侧重用力。此外


    做实验设计之前,最好先搞定这些准备工作:

    1. 明白自己实验的目的,只是找显著因子、还是要摸索最佳实验条件?

    很多情况下,严格意义的复杂的试验设计可能并不是必要的,有时候可能只需要一些简单的对比、少量序贯试验,或者边试验边调整某些因子就能更轻松达到目的的,强烈不建议还要使用复杂的试验设计。


    此外,是不是用复杂的试验设计,还取决于,试验的体系对于自己来说是完全的黑箱、还是灰箱、甚至白箱。也就是,完全两眼一抹黑,毫不了解(黑箱,深度灰箱),DOE的帮助会是较大的。有些体系,尤其是某些已经被前人发表的论文研究得非常透彻的化学反应体系,其最佳配方、投料比和最优实验条件之类的问题,往往是很清楚的,只须简单验证即可,DOE的意义就不大了。——所以,开始做之前,尝试通过查阅足够多的文献了解自己的研究对象,尽可能获取详细的信息,其实是DOE之前必须的、很重要的准备工作。有时候可能找相关的专家、前辈的老师或师兄师姐给点参考意见,往往也比直接做DOE更能起到事半功倍效果。所以,这个不可以不知道。

    不过我知道,很多情况下,做一个复杂点的试验设计,不仅仅为了某个最佳的条件,还为了一个漂亮的分析结果、方便发论文、混毕业……这种情况下,可以理解。

    2. 清楚自己实验的成本、时间、人力等局限性,以及自己可以接受的投入跟目的之间的是否有了恰当的平衡?

    在某某公司的时候,某种试验的成本相当昂贵,设备都是几千万美元的设备,人也都是昂贵的人,材料都是不可回收的昂贵材料,但Six sigma是一种类似政治口号的东西,大家谁用得不漂亮就不受尊重,升迁和加薪的机会就渺茫,所以,即使成本昂贵,也在被反复使用,然后得到一些未必有太大价值的结果,或者不用这样的方案也能用廉价方式得到的结果。所以,有些时候,不得不承认,老板被six sigma的咨询顾问公司忽悠之后(这老板在世界顶级的公司都待过,造过飞机发动机和飞机),six sigma运动化,半懂不懂地强推统计和数据处理方法,对一个公司的影响是绝对负面的。——好在百足之虫,经得起这样的折腾;好在听说后来的大老板是个工科出生的,一上来就把这种运动的影响逐渐消除掉、淡化了。

    3.  根据实验的目的、约束条件、确定试验设计方案和分析方法。

    全析因试验设计通常是笨拙的、穷尽各种可能,形成一个全排列,实验量很大。但是在有些场合,我自己经历过的,还是可行的,因为每个试验点成本很低、可以轻易并行地大规模同步实验,即使每个点都有重复、多至上千个试验点,工作量也在当时的实验目的及预算所能轻松承担的范围之内(所以我选的是带有重复的全析因试验设计方案);而且,只需要作一个方差分析,找显著因子就可以大功告成了,没有找最优实验条件之类的要求(所以,只须用Minitab中的方差分析就可以了;当然更加可以用回归分析,而且几乎不会增加什么特别的成本,但是,已经不需要了;)。

    ——但一般情况下,实验成本高、周期长的时候,才考虑其它方案。国外用response surface (回归分析找最优点)的比较多;中日东亚的确对Taguchi ,田口、正交试验设计更加情有独钟;此外,还有实验成本更低的均匀实验设计(因为试验次数更少,通常回归分析效果更好)。


    4. 根据前面的理解,选择合适的工具软件。

    以往那种查表格、手工计算的方式效率低、容易出错,合适的软件: Minitab、SAS JMP、unscramber、Design Expert 等 都是不错的选项;其它统计软件也通常都能完成类似这样或那样的任务;——即使前面特别提到的这些软件,以及其它,并不是所有的软件都提供所有这些已经发表了的方法的表格生成和结果分析的功能。所有这些软件也都是有自己的侧重和局限性的。使用的时候要先弄清自己需要的是什么,然后选合适的工具。


    5. 当常规的试验设计概念或软件不能满足条件时候怎么办? 下面的这个是,当一般的试验设计概念无法满足要求的情况下,如何计算实验表格以及分析结果。

    详情可以参考 方开泰、马长兴, 科学出版社 :正交与均匀试验设计 一书的理论解释。


    其实推荐用于D-optimal试验设计表格生成的函数和代码,不懂的地方请参考matlab相关函数的对应的文档。其它大型计算类软件应该也能完成类似的功能,不再提。


    为什么突然选择了matlab? 因为有现成的好用的函数。

    matlab对正交试验设计的支持是很弱的,只有简单的全析因和部分析因、响应曲面法和D-最优设计几种可选

    想要实现正交表格,还须自力更生,利用正交表实际是特殊的D-最优表格的事实。(参考 方开泰、马长兴:正交和均匀试验设计)

    代码实现在这里

    但是一点也不推荐用matlab来做正交试验设计表格,因为这不是它的专长。

    https://icme.hpc.msstate.edu/mediawiki/index.php/DOE_with_MATLAB_3

    DOE with MATLAB 3

    Contents

     [hide

    Abstract

    This example shows how to do multilevel full factorial designs and Taguchi designs using MATLAB.

    Author(s): Mark A. Tschopp

    Introduction to D-optimal Designs in MATLAB

    From MATLAB help:

    "Traditional experimental designs (Full Factorial Designs, Fractional Factorial Designs, and Response Surface Designs) are appropriate for calibrating linear models in experimental settings where factors are relatively unconstrained in the region of interest. In some cases, however, models are necessarily nonlinear. In other cases, certain treatments (combinations of factor levels) may be expensive or infeasible to measure. D-optimal designs are model-specific designs that address these limitations of traditional designs.

    A D-optimal design is generated by an iterative search algorithm and seeks to minimize the covariance of the parameter estimates for a specified model. This is equivalent to maximizing the determinant D = |XTX|, where X is the design matrix of model terms (the columns) evaluated at specific treatments in the design space (the rows). Unlike traditional designs, D-optimal designs do not require orthogonal design matrices, and as a result, parameter estimates may be correlated. Parameter estimates may also be locally, but not globally, D-optimal."

    Multilevel Full Factorial Design

    What if we have four factors (a, b, c, d) at three levels (1 2 3)?

    nfactors = 4;
    nlevels = 3;
    nruns = nlevels^nfactors; % 81 runs
    dfF = sortrows(rowexch(nfactors,nruns,'l','cat',1:nfactors,'levels',nlevels*ones([1,nlevels]),'tries',1))
    
    

    which gives...

    dfF =                         
    
    
         1     1     1     2
         1     1     1     2
         1     1     2     1
         1     1     2     2
         1     1     2     3
         1     1     2     3
         1     1     2     3
         1     1     3     1
         1     1     3     3
         1     2     1     1
         1     2     1     3
         1     2     1     3
         1     2     2     1
         1     2     2     2
         1     2     3     1
         1     2     3     1
         1     2     3     1
         1     2     3     2
         1     3     1     1
         1     3     1     2
         1     3     1     3
         1     3     1     3
         1     3     2     1
         1     3     2     3
         1     3     3     2
         1     3     3     2
         1     3     3     2
         2     1     1     2
         2     1     1     2
         2     1     1     3
         2     1     2     1
         2     1     2     2
         2     1     2     3
         2     1     3     1
         2     1     3     2
         2     1     3     2
         2     2     1     1
         2     2     1     1
         2     2     1     2
         2     2     1     2
         2     2     2     2
         2     2     2     3
         2     2     3     3
         2     2     3     3
         2     2     3     3
         2     3     1     1
         2     3     1     3
         2     3     2     1
         2     3     2     1
         2     3     2     1
         2     3     2     2
         2     3     3     1
         2     3     3     3
         2     3     3     3
         3     1     1     1
         3     1     1     1
         3     1     1     1
         3     1     1     3
         3     1     2     1
         3     1     3     1
         3     1     3     2
         3     1     3     3
         3     1     3     3
         3     2     1     2
         3     2     1     2
         3     2     2     1
         3     2     2     2
         3     2     2     2
         3     2     2     3
         3     2     2     3
         3     2     3     1
         3     2     3     3
         3     3     1     2
         3     3     1     3
         3     3     1     3
         3     3     2     1
         3     3     2     2
         3     3     2     3
         3     3     3     1
         3     3     3     2
         3     3     3     2
    
    

    What if we have four factors (a, b, c, d) at mixed levels (1 2 for 'a', 1 2 3 for 'b','c','d')? Just use...

    nfactors = 4;
    nruns = 54; % 2*3*3*3 runs
    dfF = sortrows(rowexch(nfactors,nruns,'l','cat',1:nfactors,'levels',[2 3 3 3],'tries',1))
    
    

    Taguchi design

    Here are the commands for L8, L12, L25 Taguchi design arrays. Notice that you can used the 'bounds' command to change the factor levels from 1 and 2 to evenly spaced numbers between bounds (-1 and +1 in this case). However, for the five factor levels in the L25 design, I removed the command to show the factor levels as 1-5. Within the Taguchi designs, 7 factors at 2 levels can be used in the L8 design, 11 factors at 2 levels can be used in the L12 design, and 5 factors at 5 levels can be used in the L25 design.

    i = 7;
    L8 = sortrows(rowexch(i,8,'l','cat',1:i,'bounds',[-1*ones([1,i]);ones([1,i])],'levels',2*ones([1,i]),'tries',100));
    i = 11;
    L12 = sortrows(rowexch(i,12,'l','cat',1:i,'bounds',[-1*ones([1,i]);ones([1,i])],'levels',2*ones([1,i]),'tries',100));
    i = 5;
    L25 = sortrows(rowexch(i,25,'l','cat',1:i,'levels',5*ones([1,i]),'tries',100));
    
    

    which give the following arrays...

    L8 array

    Again, seven factors at two levels (-1 and +1).

    L8 =                                            
    
        -1    -1    -1     1     1     1    -1
        -1    -1     1    -1     1    -1     1
        -1     1    -1    -1    -1     1     1
        -1     1     1     1    -1    -1    -1
         1    -1    -1    -1    -1    -1    -1
         1    -1     1     1    -1     1     1
         1     1    -1     1     1    -1     1
         1     1     1    -1     1     1    -1
    
    


    L12 array

    Again, eleven factors at two levels (-1 and +1).

    L12 =                                                                  
    
        -1    -1    -1     1    -1    -1     1     1    -1    -1     1
        -1    -1    -1     1     1     1    -1    -1     1    -1    -1
        -1    -1     1    -1     1    -1    -1     1    -1     1    -1
        -1     1    -1    -1    -1     1     1     1     1     1    -1
        -1     1     1    -1     1    -1     1    -1     1    -1     1
        -1     1     1     1    -1     1    -1    -1    -1     1     1
         1    -1    -1    -1    -1    -1    -1    -1     1     1     1
         1    -1     1    -1    -1     1     1    -1    -1    -1    -1
         1    -1     1     1     1     1     1     1     1     1     1
         1     1    -1    -1     1     1    -1     1    -1    -1     1
         1     1    -1     1     1    -1     1    -1    -1     1    -1
         1     1     1     1    -1    -1    -1     1     1    -1    -1
    
    


    L25 array

    Again, five factors at five levels (1-5).

    L25 =                              
    
         1     1     2     5     3
         1     2     4     1     2
         1     3     5     2     4
         1     4     3     4     5
         1     5     1     3     1
         2     1     4     4     4
         2     2     1     5     5
         2     3     3     3     2
         2     4     2     2     1
         2     5     5     1     3
         3     1     3     1     1
         3     2     2     3     4
         3     3     1     4     3
         3     4     5     5     2
         3     5     4     2     5
         4     1     5     3     5
         4     2     3     2     3
         4     3     4     5     1
         4     4     1     1     4
         4     5     2     4     2
         5     1     1     2     2
         5     2     5     4     1
         5     3     2     1     5
         5     4     4     3     3
         5     5     3     5     4
    
    

    General

    You can use these functions (sortrows, rowexch) to create other d-optimal designs. In some cases, obtaining the d-optimal designs for Taguchi matrices may not be very efficient with these functions or may require too much memory. In these cases, you can always enter the design matrix directly from Taguchi's generated matrices.

    In general, if you want a different number of factors and factor levels than the traditional Taguchi design arrays, you can produce them using the following techniques. It is recommended that your designs are balanced. That is, the number of levels for each factor (each column above) are equal. If you have 8 runs with two factor levels for factor 'a', it is best to have a design where there are four combinations with 'a' at a low level and four combinations with 'a' at a high level, etc.

    Go Back



    对3因素混合水平[3,3,4]和有交互作用,采用18次试验的方案,D-optimal的试验设计表格如下:

    warning off;
    sortrows(rowexch(3,18,'interaction','categorical',1:3,'levels',[3,3,4],'tries',1000,'maxiter',50))
    
    方差分析用matlab的anovan就可以了;



    回归分析的一个例子matlab代码来自华东理工大学黄华江博士的书

    function DOE 
    % D-优化试验设计 
    % 
    %   Author: HUANG Huajiang 
    %   Copyright 2003 UNILAB Research Center,  
    %   East China University of Science and Technology, Shanghai, PRC 
    %   $Revision: 1.0 $  $Date: 2003/07/12 $ 
     
    clear all 
    clc 
     
    % 各因素的水平 
    p = [470, 300,120 
         285, 190, 65 
         100, 80, 10]; 
     
    % D-优化试验设计:先生成settings,再将settings转变为相应实验条件expCond 
    settings = cordexch(3,13,'q');      % settings: 因子设置矩阵 
    mr = p(2,:);                        % mr: middle row, i.e., middle level 
    mr = mr(ones(13,1),:); 
    hr = (p(1,:) - p(3,:))/2; 
    hr = hr(ones(13,1),:); 
    expCond = settings.*hr + mr;        % expCond: settings的相应实验条件 
     
    % 由反应模拟器生成实验数据data 
    p1 = expCond(:,1); 
    p2 = expCond(:,2); 
    p3 = expCond(:,3); 
    y = zeros(13,1); 
    for k = 1:13 
        y(k)  = 1.25*(p2(k) - p3(k)/1.5183)./(1 + 0.064*p1(k)     ... 
                + 0.0378*p2(k) + 0.1326*p3(k))*normrnd(1,0.02); 
    end 
    data = [expCond y]     % data为实验数据矩阵(实验条件及其对应的反应速率) 
     
    % 数据分析: 由非线性模型Nonlinear Model估计参数 
    x = data(:,1:3);  
    y = data(:,4); 
    xname = str2mat('Hydrogen','n-Pentane','Isopentane'); 
    yname = 'Reaction Rate'; 
    beta0 = [1.2 0.1 0.01 0.1 1.5];             % 参数初值 
    nlintool(x,y,@hougen,beta0,[],xname,yname); 
    % rstool(x,y,[],[],xname,yname); 
    rstool(x,y,'quadratic',[],xname,yname); 
     
    [beta,resid,j] = nlinfit(x,y,@hougen,beta0) 
    ci = nlparci(beta,resid,j) 
     
    % 参数辨识结果:β1、β2、... β5 
    fprintf('Estimated Parameters:\n') 
    fprintf('\tβ1 = %.2f ± %.2f\n',beta(1),ci(1,2)-beta(1)) 
    fprintf('\tβ2 = %.3f ± %.3f\n',beta(2),ci(2,2)-beta(2)) 
    fprintf('\tβ3 = %.4f ± %.4f\n',beta(3),ci(3,2)-beta(3)) 
    fprintf('\tβ4 = %.4f ± %.4f\n',beta(4),ci(4,2)-beta(4)) 
    fprintf('\tβ5 = %.4f ± %.4f\n',beta(5),ci(5,2)-beta(5)) 
     

    发现还有同学有下面这样的问题,特地转过来:


    星号表示因模型饱和且误差没有足够的自由度而无法计算的缺失值。

    假设一个饱和全因子 DOE 模型的示例:包含因子 A、B 和 C 而无仿行、无中心点且无区组的 3 因子、两水平设计。此设计将进行 8 次试验。

    分析设计时,选择通过包含所有主效应(A、B、C)和所有交互作用项(AB、AC、BC、ABC)来拟合饱和模型。生成的方差分析表会用星号表示残差误差的 SS 值、残差误差的 MS 值、所有 F 统计量和所有 p 值:

    方差分析   

    来源    自由度    AdjSS    AdjMS    F值    P值
    模型    7    71.9880    10.2840    *    *    
    线性    3    38.9547    12.9849    *    *    
    C5    1    7.0882    7.0882    *    *    
    C6    1    7.9818    7.9818    *    *    
    C7    1    23.8848    23.8848    *    *    
    2因子交互作用    3    32.7537    10.9179    *    *    
    C5*C6    1    12.0209    12.0209    *    *    
    C5*C7    1    6.5509    6.5509    *    *    
    C6*C7    1    14.1818    14.1818    *    *    
    3因子交互作用    1    0.2796    0.2796    *    *    
    C5*C6*C7    1    0.2796    0.2796    *    *    
    误差    0    *    *    
    合计    7    71.9880


    缺失值在表格中是因为 Minitab 不可能计算这些统计量。由于残差误差有 0 个自由度 (DF),因此不可能计算这些统计量,如以下计算所示:
    • 总自由度 = 运行次数 - 1
    • 主效应自由度 = 因子水平数 - 1
    • 交互作用效应自由度 = 分量因子的自由度相乘
    • 残差误差自由度 = 总自由度 - 模型中包含的所有项的自由度之和
    因此,使用先前的示例:
    • 总自由度 = 8 - 1 = 7(8 行数据)
    • 因子 A 的自由度 = 2 - 1 = 1(因子 A 有 2 个水平)
    • 因子 B 的自由度 = 2 - 1 = 1
    • 因子 C 的自由度 = 2 - 1 = 1
    • 交互作用 AB 的自由度 = (1)*(1) = 1(因子 A 有 1 个自由度,因子 B 有 1 个自由度)
    • 交互作用 AC 的自由度 = (1)*(1) = 1
    • 交互作用 BC 的自由度 = (1)*(1) = 1
    • 交互作用 ABC 的自由度 = (1)*(1)*(1) = 1
    • 残差误差的自由度 = 7 - (1 + 1 + 1 + 1 + 1 + 1 + 1) = 0

    误差的自由度为零会导致计算失败,如下所示。通过将 Adj SS 列中的值除以 DF 列中的对应值来计算 Adj MS 列中的每个值(因子 A 的 Adj MS = Adj SS/DF = 0.0621/1 = 0.0621)。但是,由于不可能将任何值除以 0 个自由度,因此,无法计算残差误差的 Adj MS(通常称为均方误 (MSE))。

    而且,Minitab 通过将每个 Adj MS 值除以 MSE 来计算表格 F 列中的每个值。例如,因子 A 的 F 值等于 0.0621/MSE。但是由于无法计算 MSE,因此也无法计算 F 值。

    最后,根据 F 统计量计算 p 值。因此,如果 F 缺失,则 p 值也必须缺失。

    当存在包含一个仿行的两水平设计且模型中包含所有项时,方差分析表中会出现缺失的 p 值和 F 统计量。要补救这种情况,请重新拟合不含一个或多个交互作用项的模型。为确定要从饱和模型中删除的最高阶交互作用,请使用效应图估计交互作用的统计显著性。

    例如,如果选择统计 > DOE > 因子 > 分析因子设计,单击模型按钮,并从模型中删除 ABC 交互作用项,则 Minitab 可以为主效应和双因子交互作用计算方差分析表中的所有值。

    方差分析来源 自由度 Adj SS Adj MS F 值 P 值模型 6 71.7084 11.9514 42.75 0.117 线性 3 38.9547 12.9849 46.45 0.107 C5 1 7.0882 7.0882 25.35 0.125 C6 1 7.9818 7.9818 28.55 0.118 C7 1 23.8848 23.8848 85.44 0.069 2 因子交互作用 3 32.7537 10.9179 39.05 0.117 C5*C6 1 12.0209 12.0209 43.00 0.096 C5*C7 1 6.5509 6.5509 23.43 0.130 C6*C7 1 14.1818 14.1818 50.73 0.089误差 1 0.2796 0.2796合计 7 71.9880

    现在,由于误差还剩余 1 个自由度(这意味着 Minitab 可以计算 MSE、F 和 p 值),因此,Minitab 会计算所有值。



    展开全文
  • 常用实验设计方法有哪些?

    千次阅读 2020-11-03 17:49:18
    这些客观规律性往往受到各种因素的影响,因此,为了减少数据分析结果的误差,同时提高准确性和精确性,合理的实验设计是必不可少的。如果实验设计不合理,不仅会增加实验次数,延长实验周期,造成人力、物力和时间的...

    自然界和人类社会中,很多现象和事物都不是独立存在的,它们往往纵横交错在一起。数据分析的其中一个重要目的就是研究事物之间的相互关系,发现事物或现象背后客观存在的规律性。这些客观规律性往往受到各种因素的影响,因此,为了减少数据分析结果的误差,同时提高准确性和精确性,合理的实验设计是必不可少的。如果实验设计不合理,不仅会增加实验次数,延长实验周期,造成人力、物力和时间的浪费,而且会导致预期的结果难以达到,甚至导致整个研究工作失败。

    实验设计应用的范围非常广,不仅应用在生物学以及医学领域,也应用在工农业生产、微生物试验、市场调查、心理学研究以及教学科研等各种不同领域。经常使用的实验设计方法有完全随机设计、随机区组设计、交叉设计、析因设计、拉丁方设计、正交设计、嵌套设计、重复测量设计、裂区设计以及均匀设计等。不同的实验设计方法适用不同的情况。


    下面介绍的这几种实验设计方法只考虑因素的主效应作用,而不涉及因素间的交互作用。它们得到的试验数据往往不能提供对交互项的分析信息。

    完全随机设计
    完全随机设计只涉及一个处理因素,两个或多个水平,所以也称单因素设计。它是将样本中全部受试对象随机分配到各个处理因素的不同水平中(处理组中),分别接受不同的处理,然后进行对比观察。各个处理组样本含量可以相等,也可以不等,但是相等时分析效率较高。完全随机设计是最简单的实验设计方法,举个简单的例子:分析不同人种的智商差异,人种差异是处理因素,因素的水平可以是黄种人、白种人和黑人等。

    随机区组设计
    随机区组设计主要用于实验分析对象之间存在明显差异的情况,它通常将受试对象按性质(如病人的性别、年龄、体重和病情等非实验因素)差异分成N个区组,再将每个区组的受试对象分别随机分配到处理因素的不同水平组(处理组)中。随机区组设计的优点是每个区组内的受试对象有较好的同质性,排除了非实验因素对分析结果的影响,提高了分析效率。缺点是要求区组内的受试对象数目与处理组数目相等(每个处理组至少分到一个受试对象),实验结果中若有数据缺失,统计分析较麻烦。


    交叉设计
    交叉设计是一种特殊的自身对照设计,常用在临床试验中,在同一病人身上观察两种或多种处理水平的效应,消除不同病人之间的差异,减少误差。我们以两个阶段、两种处理水平为例说明操作步骤。首先将条件相近的观察对象进行配对,随机分配到两个实验组中。第一组先用处理方法A处理,然后再用处理方法B处理,处理顺序是AB;另一组则相反,先用处理方法B处理,再用处理方法A处理,处理顺序是BA。两种处理水平在全部实验过程中“交叉”进行。交叉设计实际上就是自身对照实验设计,通过“交叉”的方式将时间因素的影响分解出来,避免了时间因素对研究结果的干扰。因此该设计的最大优点是可控制时间因素及个体差异对处理方式的影响,故节约样本含量,效率较高。

    拉丁方设计
    拉丁方设计用于研究三个因素,各因素间无交互作用且每个因素的水平数相同的情况。其中有一个最重要的因素称之为处理因素,另外两个是需要加以控制的因素,分别用行和列表示。两个控制因素的水平将实验因素的r个水平随机地排列成r行r列的方阵,如下图:
     


    周次和星期是控制因素,处理因素的五个水平(ABCDE)被随机分配到方阵中。
    拉丁方设计可以从较少的实验数据中获得较多的信息,比随机区组设计更具优势。如果各因素间有交互作用,用拉丁方设计就不合适了。拉丁方设计要求每个因素的水平数必须相等,在数据采集时不能出现缺失值,否则将导致数据无法按原计划进行分析。

    有交互作用的实验设计方法
    因素之间没有交互作用的情况毕竟是少数,更多的情况是存在因素之间的交互作用。下面几种实验设计方法适用于有交互作用的情况。


    析因设计
    析因设计是将两个或两个以上因素及其各种水平进行排列组合、交叉分组的试验设计。它可以研究单个因素多个水平的效应,也可以研究因素之间是否有交互作用,同时找到最佳组合。例如,现在有两个处理因素,一个因素有2个水平,另一个因素有三个水平,那么就进行2*3=6次实验;如果有三个处理因素,每个因素都有5个处理水平,那么就进行5*5*5=125次实验。析因分析的原理就是对每个因素的每个水平都进行实验,这样能够照顾到所有的因素和水平。

    正交设计
    正交设计是析因设计的高效化。当析因设计要求的实验次数太多时,一个非常自然的想法就是从析因设计的水平组合中,选择一部分有代表性水平组合进行试验,而正交设计就能满足这个要求。


    均匀设计
    均匀设计是一种多因素多水平的试验设计,它放弃了正交表的整齐可比性,是在正交设计的基础上进一步发展而成的。均匀设计进一步提高了试验点的“均匀分散性”。均匀设计的最大优点是可以使因素的水平数很大,而试验次数又最节省。与正交设计一样,可以通过均匀设计表设计实验。

    特殊实验设计方法
    下面介绍三种特殊的实验设计方法:嵌套设计、重复测量设计和裂区设计。
    嵌套设计
    如果处理因素之间存在层次性结构,或处理因素之间有主次之分,这时就需要用到嵌套设计。例如,研究催化剂和温度两个处理因素对化学反应速度的影响就是典型的例子。如果催化剂因素有三个水平(三种催化剂),反应温度也有三个水平,那么它们的实验设计可以整理成下面的表格。
     


    在主因素催化剂种类的三个水平下,又可以分别嵌套上次因素(温度)的三个水平。

    重复测量设计
    重复测量设计广泛应用于各种科学研究中,它的显著特点就是在不同的实验条件下,从同一个受试对象身上采集到多个数据,也就是同一个受试者在不同实验条件下进行数次实验,以获得更多信息。这里的数次实验需要考虑的就是“时间因素”。最常见的重复测量设计是在药物的临床试验中,例如,比较两种不同药物的疗效,将病人随机分成两组,分别给予不同的药物,然后在不同时间作病人的动态观察。

    裂区设计
    最后介绍的这种实验设计方法是裂区设计。裂区设计最初用在农业实验中,例如,进行两因素的裂区设计,按照A因素的水平将试验田分成k大块,按照A因素的不同水平处理;然后再根据B因素的水平将每大块土地再分为z小块,每小块按照B因素的不同水平处理。

    以上介绍的这些实验设计方法基本上都采用方差分析进行数据分析得到结果。每种实验设计方法的设计思路、原理和数据分析步骤都将在后面一一详细介绍。从事科学研究的朋友千万不要错过,实验设计方法的合理是得到正确科学研究成果的基础和第一步。

    展开全文
  • 正交实验法的又一个例子

    千次阅读 2008-07-26 19:19:00
    上篇就正交实验法进行了讲解,现在再拿PowerPoint软件打印功能作为例子,希望能为大家更好地理解给方法的具体应用 假设功能描述如下:打印范围分:全部、当前幻灯片、给定范围 共三种情况;打印内容分:幻灯片、...
      
    

      上篇就正交实验法进行了讲解,现在再拿PowerPoint软件打印功能作为例子,希望能为大家更好地理解给方法的具体应用

     

      假设功能描述如下:

      • 打印范围分:全部、当前幻灯片、给定范围 共三种情况;
      • 打印内容分:幻灯片、讲义、备注页、大纲视图 共四种方式;
      • 打印颜色/灰度分: 颜色、灰度、黑白 共三种设置;
      • 打印效果分:幻灯片加框和幻灯片不加框两种方式。

    因素状态表:

    状态/因素

    A打印范围

    B打印内容

    C打印颜色/灰度

    D打印效果

    0

    全部

    幻灯片

    颜色

    幻灯片加框

    1

    当前幻灯片

    讲义

    灰度

    幻灯片不加框

    2

    给定范围

    备注页

    黑白

     

    3

     

    大纲视图

     

     

     

      我们先将中文字转换成字母,便于设计。得到:

     

    因素状态表:

    状态/因素

    A

    B

    C

    D

    0

    A1

    B1

    C1

    D1

    1

    A2

    B2

    C2

    D2

    2

    A3

    B3

    C3

     

    3

     

    B4

     

     

     

    我们分析一下:

      被测项目中一共有四个被测对象,每个被测对象的状态都不一样。

     

    选择正交表:

      1、表中的因素数>=4

      2、表中至少有4个因素的水平数>=2

      3、行数取最少的一个

     

    最后选中正交表公式:

                 

                                                             L16(45)

     

    正交矩阵为:

         

    1 2 3 4 5
    1 0 0 0 0 0
    2 0 1 1 1 1
    3 0 2 2 2 2
    4 0 3 3 3 3
    5 1 0 1 2 3
    6 1 1 0 3 2
    7 1 2 3 0 1
    8 1 3 2 1 0
    9 2 0 2 3 1
    10 2 1 3 2 0
    11 2 2 0 1 3
    12 2 3 1 0 2
    13 3 0 3 1 2
    14 3 1 2 0 3
    15 3 2 1 3 0
    16 3 3 0 2 1

     

    用字母替代正交矩阵:

    1 2 3 4 5
    1 A1 B1 C1 D1 0
    2 A1 B2 C2 D2 1
    3 A1 B3 C3 2 2
    4 A1 B4 3 3 3
    5 A2 B1 C2 2 3
    6 A2 B2 C1 3 2
    7 A2 B3 3 D1 1
    8 A2 B4 C3 D2 0
    9 A3 B1 C3 3 1
    10 A3 B2 3 2 0
    11 A3 B3 C1 D2 3
    12 A3 B4 C2 D1 2
    13 3 B1 3 D2 2
    14 3 B2 C3 D1 3
    15 3 B3 C2 3 0
    16 3 B4 C1 2 1

     

     

    我们看到:

    第一列水平值为3、第三列水平值为3、第四列水平值3、2都需要由各自的字母替代。

    1 2 3 4 5
    1 A1 B1 C1 D1 0
    2 A1 B2 C2 D2 1
    3 A1 B3 C3 D1 2
    4 A1 B4 C1 D2 3
    5 A2 B1 C2 D1 3
    6 A2 B2 C1 D2 2
    7 A2 B3 C2 D1 1
    8 A2 B4 C3 D2 0
    9 A3 B1 C3 D2 1
    10 A3 B2 C3 D1 0
    11 A3 B3 C1 D2 3
    12 A3 B4 C2 D1 2
    13 A1 B1 C1 D2 2
    14 A2 B2 C3 D1 3
    15 A3 B3 C2 D2 0
    16 A1 B4 C1 D1 1

     

    第五列去掉没有意义。通过分析,由于四个因素里有三个的水平值小于3,所以从第13行到16行的测试用例可以忽略。

     

    那么这样的话,就可以有12个测试用例了:

    1、

    测试用例编号

    PPTSTFUNCTIONPRINT001

    测试项目

    测试powerpoint打印功能

    测试标题

    打印PowerPoint文件A全部的幻灯片,有颜色,加框

    重要级别

    预置条件

    PowerPoint文件A已被打开,电脑主机已连接有效打印机

    输入

    文件AD:/系统测试.ppt

    操作步骤

    1、打开打印界面;

    2、打印范围选择“全部”;

    3、打印内容选择“幻灯片”;

    4、颜色/灰度选择“颜色”;

    5、在“幻灯片加框”前打勾;

    6、点击“确定”。                        

    预期输出

    打印出全部幻灯片,有颜色且已加框。

     

    2、

    测试用例编号

    PPTST FUNCTIONPRINT002

    测试项目

    测试powerpoint打印功能

    测试标题

    打印PowerPoint文件A全部的幻灯片为讲义,灰度,不加框

    重要级别

    预置条件

    PowerPoint文件A已被打开,电脑主机已连接有效打印机

    输入

    文件AD:/系统测试.ppt

    操作步骤

    1、打开打印界面;

    2、打印范围选择“全部”;

    3、打印内容选择“讲义”;

    4、颜色/灰度选择“灰度”;

    5、点击“确定”。      

    预期输出

    打印出全部幻灯片为讲义,灰度且不加框。

     

    3、

    测试用例编号

    PPTSTFUNCTIONPRINT003

    测试项目

    测试powerpoint打印功能

    测试标题

    打印PowerPoint文件A全部的备注页,黑白,加框

    重要级别

    预置条件

    PowerPoint文件A已被打开,电脑主机已连接有效打印机

    输入

    文件AD:/系统测试.ppt

    操作步骤

    1、打开打印界面;

    2、打印范围选择“全部”;

    3、打印内容选择“备注页”;

    4、颜色/灰度选择“黑白”;

    5、在“幻灯片加框”前打勾;

    6、点击“确定”。                        

    预期输出

    打印出全部备注页,黑白且已加框。

     

    4、

    测试用例编号

    PPTSTFUNCTIONPRINT004

    测试项目

    测试powerpoint打印功能

    测试标题

    打印PowerPoint文件A全部的大纲视图,黑白

    重要级别

    预置条件

    PowerPoint文件A已被打开,电脑主机已连接有效打印机

    输入

    文件AD:/系统测试.ppt

    操作步骤

    1、打开打印界面;

    2、打印范围选择“全部”;

    3、打印内容选择“大纲视图”;

    4、颜色/灰度选择“黑白”;

    5、点击“确定”。                        

    预期输出

    打印出全部大纲视图,黑白

      

    5、

    测试用例编号

    PPTSTFUNCTIONPRINT005

    测试项目

    测试powerpoint打印功能

    测试标题

    打印PowerPoint文件A当前幻灯片,灰度,加框

    重要级别

    预置条件

    PowerPoint文件A已被打开,电脑主机已连接有效打印机

    输入

    文件AD:/系统测试.ppt

    操作步骤

    1、打开打印界面;

    2、打印范围选择“当前幻灯片”;

    3、打印内容选择“幻灯片”;

    4、颜色/灰度选择“灰度”;

    5、在“幻灯片加框”前打勾;

    6、点击“确定”。                        

    预期输出

    打印出当前幻灯片,灰度且已加框。

     

    6、

    测试用例编号

    PPTSTFUNCTIONPRINT006

    测试项目

    测试powerpoint打印功能

    测试标题

    打印PowerPoint文件A当前幻灯片为讲义,黑白,加框

    重要级别

    预置条件

    PowerPoint文件A已被打开,电脑主机已连接有效打印机

    输入

    文件AD:/系统测试.ppt

    操作步骤

    1、打开打印界面;

    2、打印范围选择“当前幻灯片”;

    3、打印内容选择“讲义”;

    4、颜色/灰度选择“黑白”;

    5、在“幻灯片加框”前打勾;

    6、点击“确定”。                        

    预期输出

    打印出当前幻灯片为讲义,黑白且已加框。

     

    7、

    测试用例编号

    PPTSTFUNCTIONPRINT007

    测试项目

    测试powerpoint打印功能

    测试标题

    打印PowerPoint文件A当前幻灯片的备注页,有颜色,不加框

    重要级别

    预置条件

    PowerPoint文件A已被打开,电脑主机已连接有效打印机

    输入

    文件AD:/系统测试.ppt

    操作步骤

    1、打开打印界面;

    2、打印范围选择“当前幻灯片”;

    3、打印内容选择“备注页”;

    4、颜色/灰度选择“颜色”;

    5、点击“确定”。                        

    预期输出

    打印出当前幻灯片的备注页,有颜色且不加框。

     

    8、

    测试用例编号

    PPTSTFUNCTIONPRINT008

    测试项目

    测试powerpoint打印功能

    测试标题

    打印PowerPoint文件A当前幻灯片的大纲视图,有颜色

    重要级别

    预置条件

    PowerPoint文件A已被打开,电脑主机已连接有效打印机

    输入

    文件AD:/系统测试.ppt

    操作步骤

    1、打开打印界面;

    2、打印范围选择“当前幻灯片”;

    3、打印内容选择“大纲视图”;

    4、颜色/灰度选择“颜色”;

    5、点击“确定”。                        

    预期输出

    打印出当前幻灯片为讲义,黑白且已加框。

     

    9、

    测试用例编号

    PPTSTFUNCTIONPRINT009

    测试项目

    测试powerpoint打印功能

    测试标题

    打印PowerPoint文件A给定范围的幻灯片,黑白,不加框

    重要级别

    预置条件

    PowerPoint文件A已被打开,电脑主机已连接有效打印机

    输入

    文件AD:/系统测试.ppt

    操作步骤

    1、打开打印界面;

    2、打印范围选择“幻灯片”;

    3、打印内容选择“幻灯片”;

    4、颜色/灰度选择“黑白”;

    5、点击“确定”。                        

    预期输出

    打印出给定范围的幻灯片,黑白且不加框。

     

    10、

    测试用例编号

    PPTSTFUNCTIONPRINT010

    测试项目

    测试powerpoint打印功能

    测试标题

    打印PowerPoint文件A给定范围的幻灯片为讲义,有颜色,加框

    重要级别

    预置条件

    PowerPoint文件A已被打开,电脑主机已连接有效打印机

    输入

    文件AD:/系统测试.ppt

    操作步骤

    1、打开打印界面;

    2、打印范围选择“幻灯片”;

    3、打印内容选择“幻灯片”;

    4、颜色/灰度选择“颜色”;

    5、点击“确定”。                        

    预期输出

    打印出给定范围的幻灯片为讲义,有颜色且加框。

      

    11、

    测试用例编号

    PPTSTFUNCTIONPRINT011

    测试项目

    测试powerpoint打印功能

    测试标题

    打印PowerPoint文件A给定范围的幻灯片的备注页,灰度,加框

    重要级别

    预置条件

    PowerPoint文件A已被打开,电脑主机已连接有效打印机

    输入

    文件AD:/系统测试.ppt

    操作步骤

    1、打开打印界面;

    2、打印范围选择“幻灯片”;

    3、打印内容选择“备注页”;

    4、颜色/灰度选择“灰度”;

    5、在“幻灯片加框”前打勾;

    6、点击“确定”。                        

    预期输出

    打印出给定范围的幻灯片的备注页,灰度且加框。

     

    12、

    测试用例编号

    PPTSTFUNCTIONPRINT012

    测试项目

    测试powerpoint打印功能

    测试标题

    打印PowerPoint文件A给定范围的幻灯片的大纲视图,灰度

    重要级别

    预置条件

    PowerPoint文件A已被打开,电脑主机已连接有效打印机

    输入

    文件AD:/系统测试.ppt

    操作步骤

    1、打开打印界面;

    2、打印范围选择“幻灯片”;

    3、打印内容选择“大纲视图”;

    4、颜色/灰度选择“灰度”;

    5、点击“确定”。                        

    预期输出

    打印出给定范围的幻灯片的大纲视图,灰度

     

     

     

     

     

    展开全文
  • 测试用例设计——正交实验

    千次阅读 2019-11-20 19:37:00
    我们会遇到一些可能的输入数据或者这些输入数据的组合数量很大的情况,由于不可能为每个输入组合都创建测试用例,而使用一般的测试方法会产生大量的冗余测试,因此我们想到了一种新的测试用例设计方法——正交试验法...
  • 正交实验设计测试用例

    万次阅读 多人点赞 2018-11-13 15:31:10
    2 正交实验法3 利用正交实验设计测试用例的步骤:3.1 提取功能说明,构造因子--状态表3.2 加权筛选,生成因素分析表3.3 利用正交表构造测试数据集4 正交表的构成5 正交表的正交性5.1 整齐可比性5.2 均衡分散性二 用...
  • 软件测试-正交实验设计测试用例

    千次阅读 2020-04-09 17:55:00
    正交实验法又称为正交实验设计法,是根据伽瓦罗(Galois)理论,研究与处理因素实验的一种科学方法。 正交实验法利用已有的规格化的“正交表”,从大量的实验点中挑选出适量的、有代表性的点,合理地安排实验,用...
  • 1.3 单一水平正交表 1.4 混合水平正交表 1.5正交表的两个特点 1.6 混合正交表选择正交表实例 2. 用正交表设计测试用例 2.1 设计测试用例的步骤 2.2 如何选择正交表 2.3 设计测试用例时的三种情况 1) 因素...
  • 用正交实验设计测试用例

    万次阅读 多人点赞 2016-10-14 10:12:10
    作者:xuhongge 来源:xuhongge的博客 ...数学家在设计方阵时,以每一个拉丁字母表示一个民族,所以设计的方阵称为拉丁方。 什么是n阶拉丁方? 用n个不同的拉丁字母排成一个n阶方阵(n 什么是正交拉丁方? 设有两
  • 一、所谓的正交实验设计法(Orthogonal Experimenta Design Method),是从大量的实验点中挑选出适量的,有代表性的点,应用依据伽罗瓦(Galois)理论导出的“正交表”,合理安排实验的一种科学的设计方法。...
  • 软件测试中用正交实验设计测试用例 正交实验法的由来 一、正交表的由来 拉丁方名称的由来 古希腊是一个民族的国家,国王在检阅臣民时要求每个方队中每行有一个民族代表,每列也要有一个民族的代表。 数学家在...
  • 1.简介 正交试验设计法(Orthogonal experimental design), 是从大量的试验点中挑选出适量的、有代表性的点,应用依据迦罗卡瓦理论导出的“正交...◆因子的状态(水平Level):而影响实验因子的,叫做因子的状态(因子变量
  • 设计和实现高水平分布式网络爬虫

    千次阅读 2011-04-06 14:38:00
    本人翻译,原创,转载务必注明:哈尔滨工程大学李海波    设计和实现高水平分布式网络爬虫 摘要:纵观网络搜索引擎和其他特殊的搜索工具一样,依赖网络蜘蛛区获得大规模的网页进行索引和分析...
  • 理工大算法设计与分析实验报告

    千次阅读 2018-06-24 14:31:37
    实验一递归与分治算法1.1实验目的与要求1.进一步熟悉C / C ++语言的集成开发环境;2.通过本实验加深对递归与分治策略的理解和运用。1.2实验课时2学时1.3实验原理分治(分而治之)的思想:一个规模为Ñ的复杂问题的...
  •  电源控制系统可实现对大型仪器设备的实时远程控制,不仅有利于实验室的用电安全,使实验室尽可能做到无人值守,而且有利于维护大型仪器设备,提高资源的有效配置和利用率,促进教学与科研水平的提升。该系统主要...
  • 巧用随机区组设计让你实验更轻松

    千次阅读 2020-02-26 13:50:13
    当你一次次的实验,一次次的p值小于0.05,你是否对你的数据分析方法产生怀疑,当实验要求的重复数很大时,你是否觉得自己力不从心,手忙脚乱的做实验,然后接受一次次的失败,读完本文或许对你有所帮助。
  • 源码的下载地址时http://yunpan.cn/cjwwij3FcBtZV 访问密码3579 本列表源码永久免费下载地址...卷 yunpan 的文件夹 PATH 列表 卷序列号为 0000-73EC E:. ...│ 例子大全说明.txt │ 本例子永久更新地址~.url │
  • 科学研究设计七:单案例设计

    千次阅读 2017-11-18 09:06:50
    在应用行为分析领域 单案例实验设计
  • 博弈论经典例子

    万次阅读 2015-05-25 09:58:14
    通过计算机的模型实验,阿瑟得出了一个有意思的结果:不同的行动者是根据自己的归纳来行动的,并且,去酒吧的人数没有一个固定的规律,然而,经过一段时间以后,去的平均人数总是趋于60。阿瑟说,预测者自组织到一个...
  • CSS实现垂直/水平导航栏

    千次阅读 多人点赞 2019-04-11 13:04:46
    水平导航栏 导航栏 = 链接列表 导航栏需要标准的 HTML 作为基础。在我们的例子中,将用标准的 HTML 列表来构建导航栏。导航栏基本上是一个链接列表,因此使用 ul 和 li 元素是非常合适的:<ul> <li>&...
  • 系统就是这样的一个例子文件管理在块级水平。第三, sector 可以操纵本地文件系统。 这种方法的缺点就是他不允许用户将大的数据集撕裂为个文件或者用一个 utility 去实现这个。 Sector 假设任何用户能够开发...
  • 此文觉得非常有逻辑性,而且有很量子计算方面的常识介绍。大部分资料都是网络公开的,这里做了一个汇集。因此,转发到博客里。 文章目录 (一)量子是个啥? (二)各种量子技术都是啥? (三)量子计算机有啥用?...
  • IEEE-TKDE:Knowledge Engineering知识工程领域高水平论文翻译及其解读 目录 Knowledge Engineering知识工程领域高水平论文相关会议 IEEE-TKDE CIKM Knowledge Engineering知识工程领域高水平论文翻译及其...
  • kafka 0.10 client使用例子

    千次阅读 2017-07-28 15:43:23
    每个group代表代表一个独立的consumer,虽然client支持一个group对应个topic,但是为区分业务意思,我们还是约定为每个topic创建独立group。 定义:环境_group_消费者_业务含义.例如:prod_group_mind_order_...
  • (八)正交表实验

    千次阅读 2015-04-14 14:58:52
    从大量的(实验)数据(测试例)中挑选适量的,有代表性的点(例),从而合理地安排实验(测试)的一种科学实验设计方法.类似的方法有:聚类分析方法,因子方法方法等。利用因果图来设计测试用例时, 作为输入条件的原因...
  • 基于水平集方法和模型的SAR图像分割   Abstract(摘要) 这篇文章提出了一种分割SAR图像的方法,探索利用SAR数据中的统计特性将图像分区域。我们假设为SAR图像分割分配参数,并与水平集模型相结合。分布属于G...
  • matlab 实验

    千次阅读 2009-03-27 15:23:00
    实验一 Matlab语言、数字图象基本操作一、实验目的1、复习MATLAB语言的基本用法;2、掌握MATLAB语言中图象数据与信息的读取方法;3、掌握在MATLAB中绘制灰度直方图的方法,了解灰度直方图的均衡化的方法。二、实验...
  • 静态代理、JDK动态代理以及CGLIB动态代理静态代理动态代理cglib代理单例模式工厂模式观察者模式装饰器模式秒杀系统设计分布式分布式概述分布式集群微服务线程高并发分布式系统设计理念分布式系统的目标与要素...
  • (转)安富莱stm32 pid介绍以例子

    千次阅读 2018-02-12 11:16:33
    闭环控制系统的例子。比如人就是一个具有负反馈的闭环控制系统,眼睛便是传感器,充当反馈,人体系统能通过不断的修正最后作出各种正确的动作。如果没有眼睛,就没有了反馈回路,也就成了一个开环控制系统。另例...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 29,376
精华内容 11,750
关键字:

多水平实验设计例子