Stata系列-如何进行多元回归分析
进行之前补充两个背景知识:
-
t检验
t检验是检验解释变量的显著性,t检验的原假设为:某一解释变量的系数为0
我们进行t检验的目的是为了判断某个变量是否应该保留在模型中,方法是通过分析被解释变量与待分析的变量间的线性关系是否显著成立(即以多大可能成立) -
F检验
F检验是检验方程整体的显著性,F检验的原假设为:所有回归系数为0
我们进行F检验的目的是为了判断模型整体是否符合“线性假设”,方法是通过分析模型中被解释变量和解释变量间的线性关系。
1*导入数据
use grilic.dta, clear
*回归分析
reg lnw s expr tenure smsa rns
Prob>F=0.0000
表明该回归方程整体是高度显著的,即方程符合“线性假设”
P>|t| 都小于0.01
表明所有解释变量,包括常数项在1%水平都是显著地,即都应该保留在这个回归模型中
2*查看协方差矩阵
vce
主对角线元素为方差,非主对角线元素为相应的协方差
3*回归分析(无常数项)
reg lnw s expr tenure smsa rns, noc
教育回报率高达36.7%,不合理。此外,之前的回归分析,常数项很显著,即应该保留在模型中。
关于常数项
当真实模型中不包含常数项,即使加入常数项,也不会导致不一致的估计,影响较小
若真实模型中含常数项,但在回归中忽略,可能会导致严重的估计偏差
因此,一般在回归分析中包括常数项
*只对南方居民的子样本进行回归
reg lnw s expr tenure smsa if rns
*只对北方居民的子样本进行回归
reg lnw s expr tenure smsa if ~rns
*只对中学以上的子样本进行回归
reg lnw s expr tenure smsa rns if s >= 12
*只对中学以上且在南方居住的子样本进行回归
reg lnw s expr tenure smsa if s>= 12 & rns
*回到最初估计的全样本
quietly reg lnw s expr tenure smsa rns
*计算被解释变量的拟合值,并记为lnw1
predict lnw1
*计算残差
predict e, r
4*检验教育投资回报率是否为10%(教育年限s)
test s = 0.1
以上结果表明不拒绝原假设,即教育投资回报率为10%,这也和回归分析表中的数据一致
5*检验系数是否相等
test expr = tenure
以上结果表明接受原假设,即 expr 和 tenure 的回归系数一样
参考资料
《计量经济学及Stata应用》 陈强