Box-Cox转换

2021-10-02  本文已影响0人  有机会一起种地OT

Box-Cox变换后的数据,可以使回归模型满足线性、误差独立性、误差方差齐性和误差正态性,同时又不丢失信息。

对存在非线性关系的数据,可以使用复杂模型拟合非线性函数来处理非线性问题,但这样的运算更复杂。先采用相对简单的数据转换来尝试将数据关系变为近似线性关系的情况,是更明智的。

一般的数据转换方法:

上述各方法,对x_i的转换幅度依次增大。

Box-Cox转换形式为:
Y^{(\lambda)}=\begin{equation}\left\{ \begin{array}{lr} \frac{Y^{\lambda}-1}{\lambda}, & \lambda \neq 0 \\ \ln{Y}, & \lambda = 0 \end{array} \right.\end{equation}
可变参数\lambda决定具体的变换形式,\lambda=0时,变换为对数变化。对于任意取值的y_i,可改为y_i+c_i>0,保证对数的运算。

在应用中,需要估计的参数是\lambda。为使转换后的数据服从线性,即希望Y^{(\lambda)}=\beta X +\varepsilon,\varepsilon \sim N(0,\sigma^2I),则对固定\lambda\beta\sigma^2的似然为

L(\beta,\sigma^2)=\frac{1}{(\sqrt{2\pi}\sigma)^n}\exp{-\frac1{2\sigma^2(Y^{(\lambda)}-X \beta)^{'}(Y^{(\lambda)}-X \beta)}}J
J=\prod_{i=1}^n|\frac{\dd y_i^{\lambda}}{\dd y_i}|

最大化似然,求得参数\lambda的最优值。

Box-Cox转换通过变换参数\lambda来改变变换的具体形式。整个过程完全基于数据本身,从而比直接选定对数、平方根等方法要客观准确。

上一篇下一篇

猜你喜欢

热点阅读