因果推断入门14-16 乘积分解法则、混淆变量、习题

发布时间 2023-12-06 21:49:23作者: lmqljt

https://www.bilibili.com/video/BV1Mv411v7zC/?p=14&spm_id_from=pageDriver

前面的章节我们学了一些基本个因果图模型,以及一些基本的规则。

我们可以根据这些规则,把复杂的问题进行化简;当我们知道图的结构以及随机变量,和随机变量之间的联合分布;联合分布可以用其密度函数来表达,如果我们不知道这些变量之间是什么样的因果关系的话,我们只能用n维的联合的分布来表达n个随机变量之间的关;但是如果我们有额外的信息,我们得以知道这些随机变量之间有哪些额外的信息,进而知道这些随机变量之间有什么样的具体因果关系和图结构,那么可以通过这个图结构来化简分布里面的密度函数;可以把它们的密度函数变成更简单的密度函数的乘积的形式,如下图1所示。

图1

图1中,等号左边的密度函数变成更简单的密度函数的乘积的形式。等号右边的意思是说,Xi condition在Xi对应的所有父节点上,举例来说如图2所示,有5个节点,节点之间的关系如图所示。额外信息就是我们知道了如图所示的5个节点变量之间的因果关系如图2中结构所示。

图2

在这种情况下,可以证明,图1中等式左边的联合分布可以分解成等式右边的5个概率函数的乘积。这些概率都是用当前的节点Xi,condition到 Xi对应的父节点上的概率。比如第一项X1就是,X1 condition到X1的父节点上的概率,此处X1是没有父节点的,X1是一个根节点;X1没有父节点,那么等式右边的pa(X1)就是一个空集;我们就说第一项X1就是P(X1)的概率。第二项是X2 condition到其父节点上的概率,我们可看到X2的父节点是X1,那么就是condition到X1上,也即P(X2|X1),这就是第二项。第三项就是X3 condition到X3的父节点上,X3的父节点也是X1,所以P(X3|X1)是第三项。第四项应该是X4 condition在X2和X3上,P(X4|X2,X3)。最后一项是X5 condition到X4上,P(X5|X4)。所以,就由图2下部的公式分解。这是为什么呢,这里我们首先做一个条件概率的运算,我们首先。

图3