计量实现--PSM

2019-09-25 本文已影响0人古城路揸fit人

原理

$y_{i}=\left\{\begin{array}{ll}{y_{1i}} & {\text { if } D_{i}=1} \\ {y_{0i}} & {\text { if } D_{i}=0}\end{array}\right.$

$y_{1i}$ 表示个体i参加项目的收益

$y_{0i}$ 表示个体i不参加项目的收益

$y_{i}=\left(1-D_{i}\right) y_{0 i}+D_{i} y_{1 i}=y_{0 i}+\left(y_{1 i}-y_{0 i}\right) \quad D_{i}$

其中 $y_{1 i}-y_{0 i}$ 处理效应，由于 $y_{1 i}-y_{0 i}$ 为随机变量，所以我们关心平均处理效应（Average TREATMENT EFFECT,ATE）：

$\mathrm{ATE} \equiv \mathrm{E}\left(y_{1 i}-y_{0 i}\right)$

另一种说法是实际参加(被处理)的处理效应（Average TREATMENT EFFECT on the treated,ATT）:

$\mathrm{ATT} \equiv \mathrm{E}\left(y_{1 i}-y_{0 i} | D_{i}=1\right)$

难点

由于 $y_{1 i}$ 、 $y_{0 i}$ 不可能同时被观测；如果简单比较参与与不参与收益的差距，就会出现选择偏差。
$\mathrm{E}\left(y_{1 i} | D_{i}=1\right)-\mathrm{E}\left(y_{0 i} | D_{i}=0\right)=\mathrm{E}\left(y_{1 i} | D_{i}=1\right)-\mathrm{E}\left(y_{0 i} | D_{i}=1\right)+\mathrm{E}\left(y_{0 i} | D_{i}=1\right)-\mathrm{E}\left(y_{0 i} | D_{i}=0\right)$

其中 $\mathrm{E}\left(y_{0 i} | D_{i}=1\right)-\mathrm{E}\left(y_{0 i} | D_{i}=0\right)$ ，为选择偏差，即参与者如果未参加项目的收益与未参加者未参加项目的收益的差异。

解决方法

随机分组

2. 依可测变量的选择
如果存在协变量 $x_{i}$ ，称为“依可测变量选择”。如果个体对 $D_{i}$ 的选择完全取决于 $x_{i}$ ，则在给定 $x_{i}$ 的情况下，潜在结果 $(y_{1i},y_{0i})$ 将独立 $D_{i}$

stata实现

use http://ssc.wisc.edu/sscc/pubs/files/psm, clear
teffects psmatch (y) (t x1 x2), gen(match1)
gen ob=_n
save psmdata, replace
keep if t //保留实验组
keep match1 //保留实验的match1
bysort match1: gen weight=_n //计算实验组匹配了多少次
by match1: keep if _n==1 //只保留n=1的实验组
ren match1 ob //重命名
merge 1:m ob using fulldata
replace weight=1 if t //
reg y x1 x2 t [fweight=weight]
pstest x1 x2, both row mweight(weight) t(t)
pscore t x1 x2, pscore(pscore) //评分
psgraph, t(t) pscore(pscore) //画图

``

计量实现--PSM

原理

难点

解决方法

stata实现

猜你喜欢

热点阅读