计量实现

计量实现--PSM

2019-09-25  本文已影响0人  古城路揸fit人

原理

y_{i}=\left\{\begin{array}{ll}{y_{1i}} & {\text { if } D_{i}=1} \\ {y_{0i}} & {\text { if } D_{i}=0}\end{array}\right.

y_{1i}表示个体i参加项目的收益

y_{0i}表示个体i不参加项目的收益

y_{i}=\left(1-D_{i}\right) y_{0 i}+D_{i} y_{1 i}=y_{0 i}+\left(y_{1 i}-y_{0 i}\right) \quad D_{i}

其中 y_{1 i}-y_{0 i}处理效应,由于y_{1 i}-y_{0 i}为随机变量,所以我们关心平均处理效应(Average TREATMENT EFFECT,ATE):

\mathrm{ATE} \equiv \mathrm{E}\left(y_{1 i}-y_{0 i}\right)

另一种说法是实际参加(被处理)的处理效应(Average TREATMENT EFFECT on the treated,ATT):

\mathrm{ATT} \equiv \mathrm{E}\left(y_{1 i}-y_{0 i} | D_{i}=1\right)

难点

由于y_{1 i}y_{0 i}不可能同时被观测;如果简单比较参与与不参与收益的差距,就会出现选择偏差。
\mathrm{E}\left(y_{1 i} | D_{i}=1\right)-\mathrm{E}\left(y_{0 i} | D_{i}=0\right)=\mathrm{E}\left(y_{1 i} | D_{i}=1\right)-\mathrm{E}\left(y_{0 i} | D_{i}=1\right)+\mathrm{E}\left(y_{0 i} | D_{i}=1\right)-\mathrm{E}\left(y_{0 i} | D_{i}=0\right)

其中\mathrm{E}\left(y_{0 i} | D_{i}=1\right)-\mathrm{E}\left(y_{0 i} | D_{i}=0\right),为选择偏差,即参与者如果未参加项目的收益与未参加者未参加项目的收益的差异。

解决方法

  1. 随机分组

2. 依可测变量的选择
如果存在协变量 x_{i}, 称为“依可测变量选择”。如果个体对D_{i}的选择完全取决于x_{i},则在给定x_{i}的情况下,潜在结果(y_{1i},y_{0i})将独立D_{i}

stata实现

use http://ssc.wisc.edu/sscc/pubs/files/psm, clear
teffects psmatch (y) (t x1 x2), gen(match1)
gen ob=_n
save psmdata, replace
keep if t //保留实验组
keep match1 //保留实验的match1
bysort match1: gen weight=_n //计算实验组匹配了多少次
by match1: keep if _n==1 //只保留n=1的实验组
ren match1 ob //重命名
merge 1:m ob using fulldata
replace weight=1 if t //
reg y x1 x2 t [fweight=weight]
pstest x1 x2, both row mweight(weight) t(t)
pscore t x1 x2, pscore(pscore) //评分
psgraph, t(t) pscore(pscore) //画图

``
上一篇下一篇

猜你喜欢

热点阅读