大师兄的应用回归分析学习笔记(三十一):含定性变量的回归模型(四

2025-06-12  本文已影响0人  superkmi

大师兄的应用回归分析学习笔记(三十):含定性变量的回归模型(三)
大师兄的应用回归分析学习笔记(三十二):含定性变量的回归模型(五)

四、Logistic回归模型

1. 分组数据的Logistic回归模型
  1. 回归函数应该改用限制在[0,1]区间内的连续曲线,而不能再沿用直线回归方程。Logistic函数的形式为:f(x)=\frac{e^x}{1+e^x}=\frac{1}{1+e^{-x}}
  2. 因变量y_i本身只取0,1两个离散值,不适合直接作为回归模型中的因变量。由于回归函数E(y_i)=\pi_i=\beta_0+\beta_1x_i表示在自变量为x_i的条件下y_i的平均值,而y_i是0-1型随机变量,因此E(y_i)=\pi_i就是在自变量为x_i的条件下y_i等于1的比例。
2. 案例
序号 年家庭收入(万元) x 签订意向书人数n_i 实际购房人数m_i 实际购房比例p_i=m_i/n_i 逻辑变换p'_i=ln(\frac{p_i}{1-p_i}) 权重 w_i=n_ip_i(1-p_i)
1 1.5 25 8 0.320000 -0.75377 5.440
2 2.5 32. 13 0.406250 -0.37949 7.719
3 3.5 58 26 0.448276 -.020764 14.345
4 4.5 52 22 0.423077 0.31015 12.692
5 5.5 43 20 0.465116 -0.13976 10.698
6 6.5 39 22 0.564103 0.257829 9.590
7 7.5 28 16 0.571429 0.287682 6.857
8 8.5 21 12 0.571429 0.287682 5.143
9 9.5 15 10 0.666667 0.693147 3.333
  • c为分组数据的组数,本例c=9
  • 通过logit变换(令p'_i=ln(\frac{p_i}{1-p_i})),线性回归模型为p'_i=\beta_0+\beta_1x_i+\epsilon_i
  • 回归方程\hat p' = -.0866 + 0.156x
  • 决定系数r^2=0.9243,显著性P值 \approx 0,高显著度
  • 还原式的Logistic回归方程为:\hat p = \frac{exp(-0.886 + 0.156x)}{1+ exp(-0.886 + 0.156x)}
上一篇 下一篇

猜你喜欢

热点阅读