统计学

统计学(48)-广义线性模型

2020-02-09  本文已影响0人  Zhigang_Han
1、一般线性模型和广义线性模型

一般线性模型统一了不同类型的自变量,但因变量仍仅限于连续变量。而广义线性模型(Generalized Linear Model)则进一步将不同类型的因变量进行了统一,使得模型范畴更加广泛,使得因变量不仅可以是连续型的,还可以是分类和计数型的。

2、广义线性模型的基本表现形式
image.png

其中,等式右边是自变量x1,x2......xp可以是1个,也可以是多个;形式可以是分类的,也可以是定量的。等式左边是一个连接函数(Link Function), 而不是像线性回归中的具体值。正是有了这一连接函数,使得广义线性模型包含了大多数的回归模型。

3、什么是连接函数呢?

(1)所谓连接函数,是一个统称,而不是一个固定的函数,根据因变量的类型及分布不同而变化。

如在线性回归中,他就是均值μ,也就是变量y本身;在logistic回归中,它就不是因变量本身了,而是根据阳性率p变成了: image.png (也叫Logit变换);在Poisson回归中,它也不是因变量本身(如次数),而是取对数变成了 image.png


(2)因此通过指定连接函数的形式,广义线性模型可转换成相应的具体模型。


image.png
4、回归系数的检验

(1)回归系数的检验一般是Wald检验、似然比检验、score 检验(得分检验)。相信很多人在Logistic 回归或其他回归结果中见到过这三种检验的身影,当这三种检验结果不一致时,可能还为此头疼过。
这三种检验的关系,用一张图解释下:


image.png

(2)不难看出, Wald检验反映的是系数估计值与0的差异,似然比检验反映的是在系数=b和系数=0时两个对数似然值的差异,得分检验则反映了在系数=0时的斜率。
(3)在大样本情况下,三种检验方法的结果是一致的;但在小样本时往往会不一致,在这种情况下, 一般认为似然比检验的结果更为可靠。

上一篇下一篇

猜你喜欢

热点阅读