stata连享会-简书收录

静态面板数据分析

2018-11-05  本文已影响116人  CHEN_DIANDIAN

静态面板数据的主要问题

基础工作

屡次失败的经验表明,洗数据和看数据是非常基础且不可或缺的工作。基础不牢地动山摇,后面的分析全部得再来一遍,期间又会出现各种error。因此,面板数据分析的前几步毫无疑问就是

1. 数据清理

由于面板也是时间序列,为避免伪回归问题,很多人纠结是否应当先进行平稳性检验及差分。并非所有的面板数据都要进行平稳性处理,如短面板数据或N与T接近的情形,由于T信息含量不足,不考虑扰动项序列自相关。只有设定为时间序列模型的情况下才需要进行平稳性检验。

2. 描述性分析

xtdes 这个命令的重点在于看数据的轮廓:

xtdes 数据概览

xtsum 观察各变量是否正常:

xttab 类别变量

correlate 相关性分析的必要性:

P.S. 改变数据结构的两个常用命令 reshapegather

3. 画图

xtline 变量间关系可视化:与模型设定是否一致?与模型结果是否一致?

面板模型及其Stata命令概览

面板模型根据数据的结构可以分为长短面板,也可以根据模型的设定分为静态面板和动态面板。本文关注的是线性不可观测效应的面板数据模型,常用命令如下:

xtreg Fixed-, between-, and random-effects, and population-averaged linear models
xtregar Fixed- and random-effects linear models with an AR(1) disturbance
xtgls Fit panel-data models by using GLS

xtpcse Linear regression with panel-corrected standard errors
xthtaylor Hausman–Taylor estimator for error-components models
xtfrontier Stochastic frontier models for panel data
xtrc Random-coefficients model
xtivreg Instrumental variables and two-stage least squares for panel-data models
Source: Stata Longitudinal-Data/Panel-Data Reference Manual - Linear regression estimators

短面板模型

1. 混合回归

由于混合回归非常简单,人一兴奋就直接run regxtreg, fe 然后Hausman检验。这个做法相当不严谨,产生了误导性结果。记住,所有模型的第一步是进行假设检验

1.1 假设检验

混合回归 (Pooled regression) 也被称为“总体平均估计量 (Population-averaged model, or PA) ”,基本假设是不存在个体效应(包括固定效应和随机效应),因此必须对这个假设进行检验。

(1) 固定效应检验

(2) 随机效应检验

1.2 xtregreg 的区别

xtreg 默认设定是随机效应模型,混合OLS应当使用 reg 或者 xtreg, pa

1.3 混合OLS基本格式

reg y x1 x2 x3, vce cluster(id)

划重点:

2. 个体效应模型

ssc install reghdfe
一般情况下会报错:“command ftools is unrecognized”
检查ftools是否已安装:reghdfe, version
安装ftools:ssc install ftools
可能成功安装,可能继续报错:“connection timed out”
这时候就需要手动安装了:ftools手动安装包
下载zip解压到相应的ado文件夹中即可

长面板模型

1. 假设检验

2. 相应模型

注意:分析长面板数据的 xtglsxtpcse 命令都没有考虑个体效果 (fixed effects) ,他们对截面异质性的处理都是通过 OLS 估计得到的残差进行了,也就是采用OLS估计的残差估得稳健型方差-协方差矩阵。因此,上述回归中均加入了i.id。这种情形下考虑固定效应有两种方法:

(1) 加入 N-1 个虚拟变量(LSDV法)

tab id, gen(dumid)
drop dumid1
xtgls y x dumid*, p(h) corr(ar1)
长面板的估计策略

(2) 先采用 xtdata 命令去除个体效果,再采用 xtgls 命令进行估计

preserve
xtdata y x , fe clear
xtgls y x, p(h) corr(ar1)
restore

推荐采用后者,因为当 N 较大时,前者的输出结果管理起来比较繁琐。

Source: 连玉君的回答,固定效应的FGLS估计怎么做

面板工具变量法

这一块以后跟GMM一起写。(又挖个坑)

IV和GMM相关估计步骤,内生性、异方差性等检验方法

一文读懂GMM的stata操作步骤

古往今来,哪一个工具变量没有争议?寻找工具变量

变量内生性和工具变量知识汇总

Refer:陈强《高级计量经济学及stata应用(第二版)》

上一篇 下一篇

猜你喜欢

热点阅读