https://www.bilibili.com/video/BV1o541127wE/?p=21&spm_id_from=pageDriver
图1
当上一节定义了干涉之后,如何定义因果关系呢?图中X是treatment,Y是Outcome。
定义的办法就是假想给所有人吃药,然后看他们恢复的概率。然后继续假想让所有人都不吃药,再看恢复的概率。可以想象成在平行宇宙之中。如果吃药与否的结果有区别,那么X和Y之间就有因果关系。我们把因果关系叫做average causal effect平均因果效应,简称ACE。这种是在Y是离散的情况下来进行的。如果Y是连续的话,那么定义就可以推广成图中B部分的样式。
图2
现在看一下,X和Y之间的因果关系,如何计算X和Y之间的因果关系呢?
当计算的时候,有这样一个公式,叫做adjustment formula或叫做G-computation
图3
比如说这里X是服用药物情况,Y是恢复的效果,Z是性别。那么计算公式就是图2中的1所示。其中1式的左边涉及到一个干预do,这个干预do是无法计算的;但是通过1式右边是可以计算的。下面看一下之所以可以用1式的证明过程。
图4
可看到性别gender影响了两者,是一个混淆变量。