因果图 订阅
鱼骨图(又名因果图、石川图),指的是一种发现问题“根本原因”的分析方法,现代工商管理教育将其划分为问题型、原因型及对策型鱼骨图等几类。 展开全文
鱼骨图(又名因果图、石川图),指的是一种发现问题“根本原因”的分析方法,现代工商管理教育将其划分为问题型、原因型及对策型鱼骨图等几类。
信息
类    别
分析方法
特    点
简捷实用,深入直观
别    名
因果图
分    类
原因型鱼骨图、对策型鱼骨图
中文名
鱼骨图
外文名
FishboneDiagram
发明人
日本管理大师石川馨先生
鱼骨图名词解释
鱼骨图由日本管理大师石川馨先生所发明,故又名石川图。鱼骨图是 一种发现问题“根本原因”的方法,它也可以称之为“Ishikawa”或者“因果图”。其特点是简捷实用,深入直观。它看上去有些像鱼骨,问题或缺陷(即后果)标在“鱼头”处。在鱼骨上长出鱼刺,上面按出现机会多寡列出产生问题的可能原因,有助于说明各个原因是如何影响后果的。问题的特性总是受到一些因素的影响,我们通过头脑风暴法找出这些因素,并将它们与特性值一起,按相互关联性整理而成的层次分明、条理清楚,并标出重要因素的图形就叫特性要因图、特性原因图。因其形状如鱼骨,所以又叫鱼骨图(以下称鱼骨图),它是一种透过现象看本质的分析方法。鱼骨图也用在生产中,用来形象地表示生产车间的流程。
收起全文
精华内容
下载资源
问答
  • 因果图
    千次阅读
    2019-11-26 14:59:11

    因果图在软件测试用例的设计过程中,用于描述输入与输入、输入与输出之间存在的约束关系。

    针对需求规格,将原因和影响分为2组4类:输入与输出、输入与输入。

    1,输入与输出的关系主要有:恒等、非、与、或(从)
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    2,输入与输入之间同样存在异、或、唯一、要求等4种关系(从输入原因考虑)
    1在这里插入图片描述
    (a)E (互斥):表示a,b两个原因不会同时成立,两个中最多有一个可能成立。
    (b)I (包含):表示a,b,c这3个原因中至少有一个必须成立。
    (c)O(惟一):表示a,b当中必须有一个,且仅有一个成立。
    (d)R(要求):表示当a出现时,b必须出现,a出现时不可能b不出现。
    (e)M(屏蔽):表示a是1时,b必须是0,而当a是0时,b的值不一定。
    在这里插入图片描述
    对应的判定表:
    在这里插入图片描述

    更多相关内容
  • 因果图(causal graphs)

    2020-04-19 18:47:08
    因果性是人工智能中重要的研究课题,在多数真实场景中都离不开因果关系。本文来自Julian Schuessler讲述了因果图(Causal Graphs),期待感兴趣的研究者及时下载学习。
  • 根据以下关于中国象棋软件中关于走马的规则的描述,分析其因果图,并设计用例: 1.如果落点在棋盘外,则不移动棋子; 2.如果落点在棋盘内,且落点与起点不构成日字型,则不移动棋子; 3.如果落点在棋盘内,且构成日字,...
  • 使用因果图的好处1考虑了多个输入之间的相互组合、相互制约关系2能够帮助我们按一定步骤,高效率地选择测试用例,同时还能为我们指出,程序规格说明描述中存  使用因果图的好处  1考虑了多个输入之间的相互组合、...
  • 用于知识表示和概率推理的动态不确定因果图:有向循环图和联合概率分布
  • dowhy:DoWhy是用于因果推断的Python库,它支持因果假设的显式建模和测试。 DoWhy基于用于因果推理的统一语言,结合了因果图形模型和潜在结果框架
  • 因果图实验(自动售货机;实验的目的和要求;问题陈述 有一个处理单价为5角钱的饮料的自动售货机软件测试用例的设计其规格说明如下 若投入5角钱或1元钱的硬币按下橙汁或啤酒的按钮则相应的饮料就送出来若售货机没有零钱...
  • 考虑到PPP问题采用RDDL语言来描述,其中的条件概率函数(CPF)非常适合用于构建因果图(CG),所以引入因果图启发(CGH)来进行求解。提出的启发式算法称为CGHRDDL,整体求解方法是使用rddlsim模拟状态演化以及用...
  • 这是一款整理发布的因果图、树图与关联图知识分析,它能给予你所需要了解与因果图、树图与关联...该文档为因果图、树图与关联图知识分析,是一份很不错的参考资料,具有较高参考价值,感兴趣的可以下载看看
  • 软件测试因果图

    2015-05-04 19:47:20
    软件测试的资料,判定表跟因果图的相关应用
  • 将最小割集和最小径集的概念引入了因果图理论,并用于重大安全事故的定性和定量分析中。以煤矿行业为应用背景,通过最小割集、最小径集和事件对顶事件的概率影响,分析了各事件对瓦斯爆炸的影响,并在此基础上提供了...
  • 自动售货机测试用例(因果图).doc
  • 因果图实例

    热门讨论 2012-11-05 19:14:42
    这个是因果图的案例资源,具体内容请看:http://blog.csdn.net/xc5683/article/details/8125950
  • 基于动态不确定因果图的故障树分析
  • 因果3-因果图

    2021-07-21 10:14:22
    上一章我们介绍了潜在结果模型,这一章我们尝试从的角度理解因果,大家都有图论基础,我就不多赘述的基本概念了,在因果图里我们主要研究DAG(directed acyclic graph,有向无环),如1。 ...

    上一章我们介绍了潜在结果模型,这一章我们尝试从图的角度理解因果,大家都有图论基础,我就不多赘述图的基本概念了,在因果图里我们主要研究DAG(directed acyclic graph,有向无环图),如图1。

    图1. 一个DAG例子

    Bayesian Networks

    贝叶斯网络,一个概率图模型,因果图就是由此内生而来,因此先介绍它,贝叶斯网络的职责是将概率和图模型结合起来,使得我们能直接利用图表示概率关系,而想用图模型来表示概率关系,需要先提出两个假设。

    首先,我们从概率建模出发,如果我们相对一组数据的分布 P ( x 1 , x 2 , . . . , x n ) P(x_1,x_2,...,x_n) P(x1,x2,...,xn)建模,则根据条件概率的链式法则,我们可以将该分布分解为:

    P ( x 1 , x 2 , . . . , x n ) = P ( x 1 ) ∏ i P ( x i ∣ x i − 1 , . . . , x 1 ) P(x_1,x_2,...,x_n)=P(x_1)\prod_iP(x_i|x_{i-1},...,x_1) P(x1,x2,...,xn)=P(x1)iP(xixi1,...,x1)

    而如果给定图1,我们想求图1中的分布关系,我们就需要先定义图1对应的分布情况。

    因此先提出一个最基础的假设:DAG中相邻的点是依赖关系

    利用这个假设,可以推出 P ( x 1 , x 2 , x 3 , x 4 ) = P ( x 1 ) P ( x 2 ∣ x 1 ) P ( x 3 ∣ x 2 , x 1 ) P ( x 4 ∣ x 3 , x 2 , x 1 ) P(x_1,x_2,x_3,x_4)=P(x_1)P(x_2|x_1)P(x_3|x_2,x_1)P(x_4|x_3,x_2,x_1) P(x1,x2,x3,x4)=P(x1)P(x2x1)P(x3x2,x1)P(x4x3,x2,x1)。但大家还记得概率论的话就会知道,这样没加一个变量,参数就会指数级上升,如图2所示。因此光是一个依赖假设还是不够,我们需要引入独立假设,减少不必要的计算量。

    图2. 链式法则求解

    Local Markov assumption

    局部马尔科夫假设。

    为了避免指数爆炸的情况,我们想如果能让每个节点只依赖于其父节点就好了,这就是局部马尔科夫假设:给定一个DAG图,点X独立于其所有的非子孙节点。

    再基于该假设,我们可以进一步将图1的概率分布分解为 P ( x 1 , x 2 , x 3 , x 4 ) = P ( x 1 ) P ( x 2 ∣ x 1 ) P ( x 3 ∣ x 2 , x 1 ) P ( x 4 ∣ x 3 ) P(x_1,x_2,x_3,x_4)=P(x_1)P(x_2|x_1)P(x_3|x_2,x_1)P(x_4|x_3) P(x1,x2,x3,x4)=P(x1)P(x2x1)P(x3x2,x1)P(x4x3),我们称之为Bayesian network factorization(贝叶斯网络分解),即给定一个概率分布P和DAG G,如果 P ( x 1 , . . . x n ) = ∏ i P ( x i ∣ p a i ) P(x_1,...x_n)=\prod_iP(x_i|pa_i) P(x1,...xn)=iP(xipai),则P可以根据G进行分解,局部马尔科夫假设是这种贝叶斯网络分解形式的充要条件。

    Minimality assumption

    整合Local Markov assumption和”依赖“假设,我们便得到了极小假设

    1. 给定一个DAG图,点X独立于其所有的非子孙节点。

    2. DAG中相邻的点是依赖关系

    我们称关于G且满足极小假设的P是马尔科夫的。

    这就是贝叶斯网络的假设,下面我们看看因果图模型。

    Causal graph

    因果图。

    首先,定义因果关系:如果变量Y响应于变量X的变化,则X是变量Y的因。

    根据这个定义,因果图的第一个假设,Causal Edges Assumption(因果边假设):在一个有向图中,每一个父亲节点都是孩子节点的因。

    这样因果图就基于两个假设:

    1. Minimality assumption
    2. Causal Edges Assumption

    仅仅知道这两个假设理论上就可以求出所有的因果关系,但在实践中,当因果关系复杂起来就很难分析,因此我们需要总结一些基本的block。

    两个节点之间的关系

    图3是只考虑两个节点时的所有关系情况,(a)表示 x 1 x_1 x1 x 2 x_2 x2没有边,其表示的概率关系为 P ( x 1 , x 2 ) = P ( x 1 ) P ( x 2 ) P(x_1, x_2)=P(x_1)P(x_2) P(x1,x2)=P(x1)P(x2) x 1 x_1 x1 x 1 x_1 x1相互独立(Local Markov assumption);(b)表示 x 1 x_1 x1 x 2 x_2 x2之间有因果关系, x 1 x_1 x1 x 2 x_2 x2的因(Causal Edges Assumption),证明如下,我们对a和b的概率图进行贝叶斯分解得到:
    (a): P ( x 1 , x 2 ) = P ( x 1 ) P ( x 2 ) P(x_1, x_2)=P(x_1)P(x_2) P(x1,x2)=P(x1)P(x2)

    (b): P ( x 1 , x 2 ) = P ( x 1 ) P ( x 2 ∣ x 1 ) P(x_1,x_2)=P(x_1)P(x_2|x_1) P(x1,x2)=P(x1)P(x2x1)

    图3. 两节点的关系
    只有两个点的关系还是很好理解的,下面让我们看看三个点的关系。

    三个节点之间的关系

    如图4,当考虑三个节点时共有三种情况,我们首先分析chain和fork。

    图4. 三节点的关系

    chains and forks

    chains( 链式结构)和 forks (分叉结构)拥有相同的依赖关系(第10章会详细讨论),其依赖关系的传递如图4红线所示。

    当我们同时condition on x2, chains 和 forks 还拥有相同的独立关系,x1和x3的关联被x2 blocked(阻断了),即 x 1 ⊥  ⁣ ⁣ ⁣ ⊥ x 3 ∣ x 2 x_1 {\perp \!\!\! \perp} x_3|x_2 x1x3x2,如图5所示。

    图5. x2条件下的chain和fork

    从概率角度分析,chain图得到:

    P ( x 1 , x 2 , x 3 ) = P ( x 1 ) P ( x 2 ∣ x 1 ) P ( x 3 ∣ x 2 ) P(x_1,x_2,x_3)=P(x_1)P(x_2|x_1)P(x_3|x_2) P(x1,x2,x3)=P(x1)P(x2x1)P(x3x2)(Bayesian network factorization),

    两边同时除以 P ( x 2 ) P(x_2) P(x2) P ( x 1 , x 2 , x 3 ) P ( x 2 ) = P ( x 1 ) P ( x 2 ∣ x 1 ) P ( x 3 ∣ x 2 ) P ( x 2 ) \frac{P(x_1,x_2,x_3)}{P(x_2)}=\frac{P(x_1)P(x_2|x_1)P(x_3|x_2)}{P(x_2)} P(x2)P(x1,x2,x3)=P(x2)P(x1)P(x2x1)P(x3x2)

    P ( x 1 , x 3 ∣ x 2 ) = P ( x 1 ) P ( x 2 , x 1 ) P ( x 3 ∣ x 2 ) P ( x 2 ) P ( x 1 ) = P ( x 2 , x 1 ) P ( x 3 ∣ x 2 ) P ( x 2 ) = P ( x 1 ∣ x 2 ) P ( x 3 ∣ x 2 ) P(x_1,x_3|x_2)=\frac{P(x_1)P(x_2,x_1)P(x_3|x_2)}{P(x_2)P(x_1)}=\frac{P(x_2,x_1)P(x_3|x_2)}{P(x_2)}=P(x_1|x_2)P(x_3|x_2) P(x1,x3x2)=P(x2)P(x1)P(x1)P(x2,x1)P(x3x2)=P(x2)P(x2,x1)P(x3x2)=P(x1x2)P(x3x2),即 x 2 x_2 x2条件下, x 1 x_1 x1条件独立于 x 3 x_3 x3

    fork图得到 P ( x 1 , x 2 , x 3 ) = P ( x 2 ) P ( x 1 ∣ x 2 ) P ( x 3 ∣ x 2 ) P(x_1,x_2,x_3)=P(x_2)P(x_1|x_2)P(x_3|x_2) P(x1,x2,x3)=P(x2)P(x1x2)P(x3x2)(Bayesian network factorization)

    两边同时除以 P ( x 2 ) P(x_2) P(x2) P ( x 1 , x 2 , x 3 ) P ( x 2 ) = P ( x 2 ) P ( x 1 ∣ x 2 ) P ( x 3 ∣ x 2 ) P ( x 2 ) \frac{P(x_1,x_2,x_3)}{P(x_2)}=\frac{P(x_2)P(x_1|x_2)P(x_3|x_2)}{P(x_2)} P(x2)P(x1,x2,x3)=P(x2)P(x2)P(x1x2)P(x3x2)

    P ( x 1 , x 3 ∣ x 2 ) = P ( x 1 ∣ x 2 ) P ( x 3 ∣ x 2 ) P(x_1,x_3|x_2)=P(x_1|x_2)P(x_3|x_2) P(x1,x3x2)=P(x1x2)P(x3x2),即 x 2 x_2 x2条件下, x 1 x_1 x1条件独立于 x 3 x_3 x3

    collider

    图6. collider的两种情况

    如图6a,collider(对撞结构)与前两种结构不同,collider中x1和x3没有关联关系,x1和x3的关联被x2 blocked了,证明如下:

    P ( x 1 , x 3 ) = ∑ x 2 P ( x 1 , x 2 , x 3 ) = ∑ x 2 P ( x 1 ) P ( x 3 ) P ( x 2 ∣ x 1 , x 3 ) = P ( x 1 ) P ( x 3 ) ∑ x 2 P ( x 2 ∣ x 1 , x 3 ) = P ( x 1 ) P ( x 3 ) P(x_1,x_3)=\sum_{x_2}P(x_1,x_2,x_3)=\sum_{x_2}P(x_1)P(x_3)P(x_2|x_1,x_3)=P(x_1)P(x_3)\sum_{x_2}P(x_2|x_1,x_3)=P(x_1)P(x_3) P(x1,x3)=x2P(x1,x2,x3)=x2P(x1)P(x3)P(x2x1,x3)=P(x1)P(x3)x2P(x2x1,x3)=P(x1)P(x3)

    如图6b,而当在x2条件下时,x1和x3反而建立起一种虚假的关联,x1和x3的关联被x2unblocked,证明:

    P ( x 1 , x 2 , x 3 ) = P ( x 1 ) P ( x 3 ) P ( x 2 ∣ x 1 , x 3 ) P(x_1,x_2,x_3)=P(x_1)P(x_3)P(x_2|x_1,x_3) P(x1,x2,x3)=P(x1)P(x3)P(x2x1,x3)(Bayesian network factorization),

    两边同时除以 P ( x 2 ) P(x_2) P(x2) P ( x 1 , x 3 ∣ x 2 ) = P ( x 1 ) P ( x 3 ) P ( x 2 ∣ x 1 , x 3 ) P ( x 2 ) P(x_1,x_3|x_2)=P(x_1)P(x_3)\frac{P(x_2|x_1,x_3)}{P(x_2)} P(x1,x3x2)=P(x1)P(x3)P(x2)P(x2x1,x3),可见在x2条件下,x1与x3不满足条件独立。

    最后我们还可以根据collider的性质延伸出一种情况,如图7所示,如果我们condition on x2的子孙,也会产生虚假的关联,这个关联流向为x4->x2->(x1,x3)。

    图7. collider的子孙

    D-separation

    现在我们对上面谈到的情况对点之间的关系进行总结,将几个点之间的关系拓展到整个图。

    首先我们正式定义blocked概念。对于单条路径,如果:

    1. 路径中存在chain …->W->…或者fork…<-W->…结构, W ∈ Z W\in Z WZ
    2. 路径中存在collider …->W<-…, W ∉ Z W \notin Z W/Z且W的子孙 d e ( W ) ∉ Z de(W)\notin Z de(W)/Z

    则称X和Y之间的这条路径被条件集Z blocked(阻断),条件集Z可以是空集。与之相对,unblocked路径便是不满足blocked条件的路径。

    然后基于blocked,我们定义d-separation,如果:

    **两个顶点集合X和Y之间的路径全部被Z blocked,则称X和Y被Z d-separation。**如果二者之间存在unblocked路径,则称X和Y是d-connected。

    再扩展到整个图的关系,首先我们定义一些符号:如果在Z条件下,X和Y在图G中是d-separation的,则 X ⊥  ⁣ ⁣ ⁣ ⊥ G Y ∣ Z X {\perp \!\!\! \perp}_G Y|Z XGYZ;如果在Z条件下,X和Y在分布P中是条件独立的,则 X ⊥  ⁣ ⁣ ⁣ ⊥ P Y ∣ Z X {\perp \!\!\! \perp}_P Y|Z XPYZ

    有了这些符号,我们定义global Markov assumption

    给定P关于G是马尔科夫的(满足local Markov assumption),如果在Z条件下,X和Y在G中是 d-separation 的,则在Z条件下,X和Y在分布P中是条件独立的,即:

    X ⊥  ⁣ ⁣ ⁣ ⊥ G Y ∣ Z = > X ⊥  ⁣ ⁣ ⁣ ⊥ P Y ∣ Z X {\perp \!\!\! \perp}_G Y|Z =>X {\perp \!\!\! \perp}_P Y|Z XGYZ=>XPYZ

    local Markov assumption,global Markov assumption 和 Bayesian network factorization是不同角度的理解,他们三者是完全等价的,可以将这三者统称为Markov assumption,或者说P关于G是马尔科夫的。

    图8. 因果关联
    这一章我们详细探讨了因果图中点与点之间关系,并学习了如何分辨关系以及使其独立的方法。但在因果推理中,我们希望得到的是因果关系,而不是独立关系,这需要一些方法能够抛开非因果关联,只留下因果关联,如图8所示,只考虑蓝色线。然后计算因果效应。后面我们会进一步学习因果模型,看他是如何解决这些问题的。

    Reference

    Introduction to Causal Inference

    展开全文
  • 动态不确定因果图用于复杂系统故障诊断
  • 使用动态不确定因果图为事件/故障树建模,以更好地进行概率安全评估
  • 说起质量改善,很多人往往马上想起“六西格玛”的方法论。诚然,这是一整套当今世界最先进的质量管理的理念与工具集。但是从国内众多企业实施六西格玛项目的成败得失来看,实施六西格玛是需要一定前提条件的:比如...
  • 因果图的经典推理算法是NP难的,因此需要寻找高效的推理算法。对二元决策图进行改进,并提出一种因果图向改进的二元决策图转换的方法。利用改进的二元决策图推理省略了割集不交化的过程,得到不交化割集,减小推理...
  • 《软件测试》---因果图-测试用例设计.doc
  • 基于因果图的FMDP问题的任务层次图的动态优化方法,周建才,王红兵,分层强化学习(Hierarchical Reinforcement Learning, HRL)是解决强化学习维数灾难问题的一种重要方法。分层强化学习的一个重要问题是任务的��
  • 用于知识表示和概率推理的动态不确定因果图:连续变量,不确定证据和失败预测
  • 如果在测试时必须考虑输入条件的各种组合,则可能的组合数目将是天文数字,因此必须考虑采用一种适合于描述多种条件的组合、相应产生多个动作的形式来进行测试用例的设计,这就需要利用因果图(逻辑模型)。3.因果图...
  • 原标题:因果推断简介之五:因果图 (Causal Diagram)编辑部于2019年10月在微信端开启《朝花夕拾》栏目,目的是推送2013年(含)之前主站发表的优秀文章,微信端与主站的同步始于2013年年初,然而初期用户量有限,故...

    原标题:因果推断简介之五:因果图 (Causal Diagram)

    编辑部于2019年10月在微信端开启《朝花夕拾》栏目,目的是推送2013年(含)之前主站发表的优秀文章,微信端与主站的同步始于2013年年初,然而初期用户量有限,故优质文章可能被埋没。

    21d9828eab2fd1c04d163e1b83805ef9.png

    这部分介绍Judea Pearl 于 1995 年发表在 Biometrika 上的工作 “Causal diagrams for empirical research”,这篇文章是 Biometrika 创刊一百多年来少有的讨论文章,Sir David Cox,Guido Imbens, Donald Rubin 和 James Robins 等人都对文章作了讨论。由于 Judea Pearl 最近刚获得了图灵奖,我想他的工作会引起更多的关注(事实上计算机界早就已经过度的关注了)。

    一 有向无环图和 do 算子

    为了避免过多图论的术语,这里仅仅需要知道有向图中“父亲”和“后代”的概念:有向箭头上游的变量是“父亲”,下游的变量是“后代”。在一个有向无环图(Directed Acyclic Graph;DAG)中,记所有的节点集合为 。这里用 表示连续变量的密度函数和离散变量的概率函数。有两种观点看待一个 DAG:一是将其看成表示条件独立性的模型;二是将其看成一个数据生成机制。当然,本质上这两种观点是一样的。在第一种观点下,给定 DAG 中某个节点的“父亲”节点,它与其所有的非“后代”都独立。根据全概公式和条件独立性,DAG 中变量的联合分布可以有如下的递归分解:

    其中 表示 的“父亲”集合,即所有指向 的节点集合。

    7399661bfdd8b5e20180f8756876306d.png

    Figure 1: An Example of Causal Diagram

    例子:在 Figure 1 中,联合分布可以分解成为

    如果将 DAG 看成一个数据生成机制,那么它和下面的非参数结构方程模型是等价的:

    注意,这个联立方程组是“三角的”(triangular)或者“递归的”(recursive),因为 DAG 中没有环,方程组中也就没有反馈。计量经济学中的联立方程组模型 (simultaneous equation model: SEM),并不在这个讨论的框架下。DAG 用于描述数据的生成机制,而不常用于描述系统均衡时的状态;后者主要是 SEM 的目的。这样描述变量联合分布或者数据生成机制的模型,被称为“图模型”或者“贝叶斯网络”(Bayesian network)。

    显然,一个有向无环图唯一地决定了一个联合分布;反过来,一个联合分布不能唯一地决定有向无环图。反过来的结论不成立,对我们的实践有很重要的意义,比如 Figure 2 中的两个有向无环图,原因和结果不同,图的结构也不同;但是,我们观测到的联合分布 可以有两种分解 和 因此,我们从观测变量的联合分布,很难确定“原因”和“结果”。在下一节图模型结构的学习中,我们会看到,只有在一些假定和特殊情形下,我们可以从观测数据确定“原因”和“结果”。

    用一个 DAG 连表示变量之间的关系,并不是最近才有的。图模型也并不是 Judea Pearl 发明的。但是,早期将图模型作为因果推断的工具,成果并不深刻,大家也不太清楚仅仅凭一个图,怎么能讲清楚因果关系。教育、心理和社会学中常用的结构方程模型(structural equation model: SEM),就是早期的尝试;甚至可以说 SEM 是因果图的先驱。(注意,这里出现的两个 SEM 表示不同的模型!)

    DAG 中的箭头,似乎表示了某种“因果关系”。但是,要在 DAG 上引入“因果”的概念,则需要引进 do 算子,do 的意思可以理解成“干预” (intervention)。没有“干预”的概念,很多时候没有办法谈因果关系。在 DAG 中 (也可以记做 ),表示如下的操作:将 中指向 的有向边全部切断,且将 的取值固定为常数 . 如此操作,得到的新 的联合分布可以记做 可以证明,干预后的联合分布为

    请注意, 和 在绝大多数情况下是不同的。

    例子:考虑如下的两个 DAG:

    fd74516005430d49c7868330aabb5777.png

    在 Figure 2 (1) 中,有 。由于 是 的“原因”,“条件”和“干预” ,对应的 的分布相同。但是在 Figure 2 (2) 中,有 . 由于 是 的“结果”,“条件”(或者“给定”)“结果”,“原因”的分布不再等于他的边缘分布,但是人为的“干预”“结果” ,并不影响“原因” 的分布。

    根据 do 算子,便可以定义因果作用。比如二值的变量 对于 的平均因果作用定义为

    上面 do 算子下的期望,分别对应 do 算子下的分布。这样在 do 算子下定义的因果模型,被已故计量经济学家 Halbert White 称为 Pearl Causal Model (PCM; White and Chalak 2009)。Pearl 在其书中写到:

    “I must take the opportunity to acknowledge four colleagues who saw clarity shining through the do(x) operator before it gained popularity: Steffen Lauritzen, David Freedman, James Robins and Philip David. Phil showed special courage in pringting my paper in Biometrika, the journal founded by causality’s worst adversary – Karl Pearson.” (Pearl, 2000)

    在书中 Pearl 论述了 RCM 和 PCM 的等价性,即

    fb0bf0aa560c6cb7c3fe9f0605a1a380.png

    其中,表示潜在结果。要想说明两个模型的等价性,可以将潜在结果嵌套在 DAG 所对应的数据生成机制之中,所有的潜在结果都由这个非参数结构方程模型产生:

    其中, 表示 除去 的父亲节点。上面的方程表示:将 的值强制在 时,DAG 系统所产生的 值。这个意义下,do 算子导出的结果,就是“潜在结果”。

    二 d分离,前门准则和后门准则

    在上面的叙述中,如果整个 DAG 的结构已知且所有的变量都可观测,那么我们可以根据上面 do 算子的公式算出任意变量之间的因果作用。但是,在绝大多数的实际问题中,我们既不知道整个 DAG 的结构,也不能将所有的变量观测到。因此,仅仅有上面的公式是不够的。

    下面,我将介绍 Judea Pearl 提出的“后门准则”(backdoor criterion)和“前门准则”(frontdoor criterion)。这两个准则的意义在于:(1)某些研究中,即使 DAG 中的某些变量不可观测,我们依然可以从观测数据中估计出某些因果作用;(2)这两个准则有助于我们鉴别“混杂变量”和设计观察性研究。

    前门准则和后门准则,都涉及了 d 分离(d-seperation)的概念。

    定义( d 分离): 设 , , 是 DAG 中不相交的节点集合, 为一条连接 中某节点到 中某节点的路径 (不管方向)。如果路径 上某节点满足如下的条件:

    在路径 上, 点处为 结构 (或称冲撞点,collider),且 及其后代不在 中;

    在路径 上, 点处不是 结构,且 在 中,

    那么称 阻断 (block) 了路径 。进一步,如果 阻断了 到 的所有路径,那么称 d 分离 和 ,记为 。

    下面介绍 Pearl (1995) 的主要工作: 后门准则和前门准则。

    5b3b5b407f1298dfbb1ab6d4b210823f.png

    后门准则:在 DAG 中,如果如下条件满足:

    中节点不能是 的后代;

    阻断了 之间所有指向 的路径(这样的路径可以称为后门路径);

    则称变量的集合 相对于变量的有序对 满足后门准则。进一步,若 相对于变量的有序对 满足后门准则,其中 和 是 和 中的任意节点;那么称变量的集合 相对于节点集合的有序对 满足后门准则。

    为了理解因果图的概念,下面的简短证明是很有必要的。

    证明:在 Figure 3 (a) 中,

    前门准则:在 DAG 中,称节点的集合 相对于有序对 满足前门准则,如果

    切断了所有 到 的直接路径;

    到 没有后门路径;

    所有 到 的后门路径都被 阻断。

    证明:Figure 3 (b) 中蕴含了条件独立性,将在推导中用到: 。

    88f4429cf397a2e698243d8788d43008.png

    Pearl 在书中讲了一个非常有趣的例子,来说明前门准则的用处。

    三 回到 Yule-Simpson’s Paradox

    在第一节中,我们看到了经典的 Yule-Simpson’s Paradox。记 为处理(吃药与否); 为结果(存活与否), 是用于分层的变量(在最开始的例子中, 是性别;在这里我们先将 简单地看成某个用于分层的变量)。悖论存在,是因为 和 正相关;但是按照 的值分层后, 和 负相关。分,还是不分?—–这是一个问题!这在实际应用是非常重要的问题。

    不过,仅仅从“相关”(association)的角度讨论这个问题,是没有答案的。从“因果”(causation)的角度来看,才能有确切的回答。解释 Yule-Simpson’s Paradox,算是因果图的第一个重要应用。

    043bf0b0da40076fb5ca7acfda428613.png

    下面,我将以上面的 Figure 4 中的四个图为例说明,三个变量之间的关系的复杂性。

    图(a):根据后门准则, 阻断了 到 的后门路径,因此,根据 做调整可以得到 对 的因果作用。如果实际问题符合图(a),那么我们需要用调整后的估计量。

    图(b): 是 的“后代”且是 的“父亲”。很多地方称,此时 处于 到 的因果路径上。直观的看,如果忽略 ,那么 和 之间的相关性就是 对 的因果作用,因为 和 之间的后门路径被空集阻断,我们无须调整。如果此时我们用 进行调整,那么得到的是 到 的“直接作用”。不过,什么是“直接作用”,我们将会在后面讨论;这里只是给一个形象的名字。

    图(c):和图(b)相同, 和 之间的相关性就是因果作用。但是,复杂性在于 和 之间有一个共同的但是不可观测的原因 。此时,不调整的相关性,是一个因果关系的度量。但是,如果我们用 进行调整,那么给定 后, 和 相关, 和 之间的后门路径被打通,我们得到的估计量不再具有因果的含义。这种现象发生的原因是, 之间形成了一个 结构:虽然 和 之间是独立的,但是给定 之后, 和 不再独立。

    图(d):这个图常常被 Judea Pearl 用来批评 Donald Rubin,因为它存在一个有趣的 结构。在这个图中,由于 结构的存在, 和 之间的后门路径被空集阻断,因此 和 之间的相关性就是因果性。但是由于 结构的存在,当我们用 进行调整的时候, 和 之间打开了一条“通路”(它们不再独立),因此 和 之间的后门路径被打通,此时 和 之间的相关性不再具有因果的含义。

    我个人认为,因果图是揭开 Yule-Simpson’s Paradox 神秘面纱的有力工具。正如 Judea Pearl 在他的书中写到,不用因果的语言来描述这个问题,我们是讲不清楚这个悖论的。当然,因果的语言不止因果图,Judea Pearl 的解释始终不能得到 Donald Rubin 的认可。

    四 讨论

    用一个图来描述变量之间的因果关系,是很自然和直观的事情。但是,这并不意味着 Pearl 的理论是老妪能解的。事实上,这套基于 DAG 的因果推断的语言,比传统的 Neyman-Rubin 模型要晦涩很多。DAG 在描述因果关系的时候,常常基于很多暗含的假定而并不明说,这也是 DAG 并没有被大家完全接受的原因。传统的因果推断的语言,开始于 Jerzy Neyman 的博士论文;Donald Rubin 发展这套“潜在结果”的语言,并将它和缺失数据的理论联系在一起,成为统计界更多使用的语言。

    在实际中,人们对于图模型的批评从未中断。主要的问题集中在如下的方面:

    现实的问题,是否能用一个有向无环图表示?大多数生物学家看到 DAG 的反应是“能不能用图表示反馈?”的确,DAG 作为一种简化的模型,在复杂系统中可能不完全适用。要想将 DAG 推广到动态的系统,或者时间序列中,还有待研究。

    Pearl 引入的 do 算子,是他在因果推断领域最主要的贡献。所谓 “do”,就是“干预”,Pearl 认为干预就是从系统之外人为的控制某些变量。但是,这依赖于一个假定:干预某些变量并不会引起 DAG 中其他结构的变化。这个假定常常会受到质疑,但是质疑归质疑,Pearl 的这个假定虽然看似很强,但根据观测数据却不可检验。这种质疑并不是 Pearl 的理论独有的缺陷,这事实上是一切研究的缺陷。比如,我们用完全随机化试验来研究处理的作用,我们要想将实验推广到观察性的数据或者更大的人群中去,也必须用到一些不可验证的假定。

    很多人看了 Pearl 的理论后就嘲笑他:难道我们可以在 DAG 中干预“性别”?确实,离开了实际的背景,干预性别似乎是不太合理的。那这个时候,根据 Pearl 的 do算子得到的因果作用意味着什么呢?可以从几个方面回答这个问题。很多问题,我们不能谈论“干预性别”,也不能谈论“性别”的“因果作用”。“性别”的特性是“协变量”(covariate),对于这类变量(如身高、肤色等),谈论因果作用不合适,因为我们不能想象出一个可能的“实验”,干预这些变量。

    上面的回答基于“实验学派”(experimentalists’)的观点,认为不可干预,就没有“因果”。但是,如果认为只要有数据的生成机制,就有因果关系,那么算出性别的因果作用也不奇怪。(计量经就学一直有争议,以 Joshua Angrist、Guido Imbens 等为首的“实验派”,和以 James Heckman 为首的“结构方程模型”派,有过很激烈的讨论。)

    有些问题中性别的因果作用是良好定义的。比如,我们可以人工的修改应聘者简历上的名字(随机的使用男性和女性名字),便可以研究性别对于求职的影响,是否存在性别歧视等等(已有研究使用过这种实验设计)。

    一个更为严重的问题是,实际工作中,我们很难得到一个完整的 DAG,用于阐述变量之间的因果关系或者数据生成机制,使得 DAG 的应用受到的巨大的阻碍。不过,从观测数据学习 DAG 的结构,确实是一个很有趣且重要的问题,这留待下回分解。

    在结束时,留些一些思考的问题:

    在何种意义下,后门准则的条件,等价于可忽略性,即 ?

    在第一节的 Yule-Simpson’s Paradox 中,我们最终选择调整的估计量,还是不调整的估计量?

    关于作者

    2f2ce8bc6e2b232ecea4bd52888d14cc.png

    丁鹏,2004-2011 年在北京大学概率统计系学习,获得学士和硕士学位;2011-2015 年在哈佛大学统计系学习,获得博士学位;2015 年在哈佛大学流行病学系做博士后;2016 年加入伯克利统计系任教。研究方向是因果推断。

    作者:丁鹏

    责任编辑:

    展开全文
  • 因果图方法一.方法简介1.定义:是一种利用图解法分析输入的各种组合情况,从而设计测试用例的方法,它适合于检查程序输入条件的各种组合情况。2.因果图法产生的背景:  因果图方法  一.方法简介  1.定义:是一种...
  • 用于知识表示和概率推理的动态不确定因果图:统计库,矩阵和应用
  • 因果图生成判定表

    2013-05-31 13:59:15
    本课程资源主要借助于C++实现了基本的因果图生成判定表,文中使用的是层次深度遍历策略。

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 39,170
精华内容 15,668
关键字:

因果图