unique平均数
2019-10-15 本文已影响0人
古城路揸fit人
由来
有每个人的数据,求社区户主平均年龄。
此时不能简单的mean,也不能加权的mean,此时你要求的是在个人数据库中的社区层面的每个家庭一个unique数据的平均数。
duplicates tag classid year, gen(mistake)
bysort classid year: replace mistake=0 if (_n != 1)
bysort schids:egen chnb02__ = mean(chnb02) if mistake!=0
bysort schids:egen chnb02___ = mean(chnb02__)
replace chnb02 =chnb02___ if chnb02==.
replace chnb02 = floor(chnb02)
tab chnb02 $chn,m
cap drop chnb02__ chnb02___ mistake