2024-03-01 Rubin因果模型

2024-02-29  本文已影响0人  胜果铺子

Rubin因果模型

这是Donald Rubin对因果关系给出的模型。

理想状态下,我们把因为关系定义为,施加处理和不施加处理这两种情况下结果的差别。对于一个个体u,我们希望计算出,有施加处理的结果Y_t(u)与没有施加结果的处理Y_c(u)的差值。

Y_t(u) - Y_c(u)

就好比对于一个人。吃阿司匹林后有没有头疼,与不吃阿司匹林后有没有头疼,这两个结果的差别。

对于一个个体,无法同时观测到这两种情况的结果

因为要么你给他吃药,要么不给他吃药。不论哪种情况,你都只能观测到上述式子里面的其中一个值。无法同时测量吃药和不吃药两种情况的结果。

平均因果效应

个体无法测量,但是一个群体的平均就可以测量。

这就可以“解释”fisher的随机试验。它相当于把一部分人分配到实验组,我们能测到这一组人的平均Y_t。另一组人分配到控制组,我们能测到这一组人的平均Y_c。虽然另外一半数据测不到,但是假如分配是随机的,而且满足Stable unit treatment value assumption (SUTVA)假设。则这两个平均的差值是群体差值的好的估计。

If the sample were larger and the variance were less, the average causal effect would be closer to the true average causal effect regardless of the specific units randomly assigned to treatment.

费舍精确检验

零假设:假设治疗没有任何效果。(意思就是对于所有的u,Y_t == Y_c)

怎么检验呢?假设没有效果,那么所有的Y_t和Y_c都是相等的。虽然我们实验只观测到了一半的值。(如前所说,吃药或者没吃药,只能测一个。)但是因为我们假设对于每个个体都没效果,所以我们可以直接把缺失的值填上。

在这种假设下,我们遍历各种可能的分配情况。对于每种分配我们都计算 结果差的平均值。如果平均值大于我们实际实验得出的差值,就记为1,否则0,求和。然后与所有组合数求比例。知道有多少个可能的分配会得出比我们还大的差值。这个比例就是p值。

这就是零假设成立下,观察到更明显效果的概率。

上一篇下一篇

猜你喜欢

热点阅读