大师兄的应用回归分析学习笔记(十七):多重共线性的情形及其处理(

2025-03-06  本文已影响0人  superkmi

大师兄的应用回归分析学习笔记(十六):多重共线性的情形及其处理(一)
大师兄的应用回归分析学习笔记(十八):多重共线性的情形及其处理(三)

三、多重共线性的诊断

1. 方差扩大因子法
  • 式中L_{jj}x_j的离差平方和
  • C_{jj}作为衡量自变量x_j的方差扩大程度的因子是恰如其分的
  • R^2_j为自变量x_j对其余p-1个自变量的复决定系数,可以证明c_{jj}=\frac{1}{1-R^2_j}
  • 如果R^2很大,则认为x_1,x_2可能存在严重的多重共线性
  • R^2和样本量n有关,当样本量较小时,R^2容易接近1
  • 所以当样本量不算小,而且R^2接近1时,可以肯定存在严重的多重共线性
2. 特征根判定法
2.1 特征根分析
2.1 条件数
  • 通常认为0<k<10时,设计矩阵X没有多重共线性
  • 10\leq k<100时,存在较强的多重共线性;
  • k\geq 100时,存在严重的多重共线性。
  • 从条件数看到,最大的两个条件数k_6=116.995,k_5=101.639
  • 说明自变量间存在严重的多重共线性。
  • 可以由条件数表中右边的方差比例粗略判定哪几个自闭那辆间存在共线性,如果有某几个自变量的方差比例值在某一行同时较大(接近1),则这几个自闭间就存在多重共线性。
  • 从第6行看,x_5对应的0.91方差比例0.91最大,说明x_5与x_1,x_2,x_3,x_4之间存在强的付共线性。
  • 第5行常数项方差比例0.96最大,x_5对应的方差比例0最小,其他变量的方差比例再0.11~0.39之间,说明x_1,x_2,x_3,x_4之间存在一个线性组合约等于常数。
  • 在求特征根和特征向量时数据要标准化,以消除量纲的影响。
  • 由于设计矩阵X的第一列有一列1,所以在标准化时变量不能减去均值,而是直接除以每列数据平方和的平方根。
  • 包括每一列1也做同样的变换,得标准化的设计矩阵X',其中每列都是单位列向量,列平方和等于1,然后再对X'X求特征根和特征向量。
3.直观判定法
  • 当增加或剔除一个自变量,其他自变量的回归系数的估计值或显著性发生较大变化时,认为回归方程存在严重的多重共线性。
  • 当定性分析认为一些重要的自变量在回归方程中没有通过显著性检验时,可初步判断存在严重的多重共线性。
  • 当与因变量之间的简单相关系数绝对值很大的自变量在回归方程中没有通过显著性检验时,可初步判断存在严重的多重共线性。
  • 当有些自变量的回归系数的数值大小与预期相差很大,甚至正负号与定性分析结果相反时,存在严重的多重共线性问题。
  • 在自变量的相关矩阵中,当自变量间的相关系数较大时会出现多重共线性问题。
  • 当一些重要的自变量的回归系数的标准误差较大时,可能存在多重共线性。
上一篇 下一篇

猜你喜欢

热点阅读