疑问

2021-04-14  本文已影响0人  来到了没有知识的荒原

为什么因果图上去掉了那条边,就意味着让未服药的女性也服了药。或者说怎么通过去了一条边达到了RCT(随机对照实验的效果)?

2021-09-07

这里有10条数据:

X(穿鞋睡) Y(喝酒) Z(头疼)
1 1 1
1 1 1
1 1 1
1 1 1
0 0 0
0 0 0
0 0 0
0 0 0
1 0 0
0 1 1

计算使用干预和不使用干预的ATE(average treatment effect),也就是estimate causal effect

不干预:(计算条件概率)

ATE=E[Y|X=1]-E[Y|X=0]
(实际上E[Y|X=1]-E[Y|X=0]叫associational difference,E[Y(1)]-E[Y(0)]才是ATE(或者causal difference))
计算E[Y|X=1]=4/5
\begin{align} E[Y|X=1] & =P(Y=1|X=1)*1 + P(Y=0|X=1) * 0 \\ & =P(Y=1|X=1) \\ & =\sum_{z} P(Y=1,z|X=1) P(z) \\ & =\sum_{z} P(Y=1|z,X=1) P(z|X=1) \\ & =P(Y=1|Z=1,X=1) P(Z=1|X=1) +P(Y=1|Z=0,X=1)P(Z=0|X=1) \\ & =1 * 4/5+ 0* 1/5 = 4/5 \end{align}

计算E[Y|X=0]=1 * 1/5 + 0 * 4/5 = 1/5

ATE=E[Y|X=1]-E[Y|X=0] =3/5

其中
P(Y=1|Z=1,X=1) =1 \\ P(Y=1|Z=0,X=1)=0 \\ P(Y=1|Z=1,X=0) =1 \\ P(Y=1|Z=0,X=0) =0 \\

下面还要用到

干预:(do-operation)

ATE=E[Y|do(X=1)]-E[Y|do(X=0)] \\

计算E[Y|do(X=1)]=4/5


\begin{align} E[Y|do(X=1)] & =P(Y=1|do(X=1))*1 + P(Y=0|do(X=1)) * 0 \\ & =P(Y=1|do(X=1)) \\ & =E_{z}[ P(Y=1|z,X=1)] (这一步来源于上图)\\ & =\sum_{z} P(Y=1|z,X=1) P(z) \\ & =P(Y=1|Z=1,X=1) P(Z=1) +P(Y=1|Z=0,X=1) P(Z=0)\\ & =1 * 1/2+ 0* 1/2= 1/2\\ \end{align}

计算E[Y|do{X=0}]=1 * 1/2 + 0 * 1/2 = 1/2

ATE=E[Y|do(X=1)]-E[Y|do(X=0)] =0

总结

可以看出来,不用干预,得到的ATE是3/5,表示存在X对Y因果效应,这当然是错误的,因为被Z混淆了。

使用干预后,得到的ATE是0,表明X对Y没有因果效应。

E[Y|X=1] = P(Y=1|Z=1,X=1) P(Z=1|X=1) +P(Y=1|Z=0,X=1) P(Z=0|X=1)

E[Y|do(X=1)] = P(Y=1|Z=1,X=1) P(Z=1) +P(Y=1|Z=0,X=1) P(Z=0)

两个公式的区别就是下面P(Z|X)变成P(Z)了。一方面是do之后,backdoor没了,X和Z独立,所以P(Z|X)=P(Z),另一方面:P(Z=1)=P(Z=1|X=1)P(X=1) + P(Z=1|X=0)P(X=0),相当于如果让P(Z=1|X=0)强行等于P(Z=1|X=1),就达到了P(Z=1)=P(Z=1|X=1),也就是“修改了数据”,让数据中没有穿鞋睡的人穿鞋了,也就是pearl说的,条件概率是改变看世界的角度,干预do改变了世界。

疑问

我们通过对已观测的数据进行干预,得到的ATE,和我们真正进行随机对照试验(RCT)后得到的ATE有什么本质上的区别?(跟我开头那个疑问有点联系)

上一篇下一篇

猜你喜欢

热点阅读