线性模型——对数几率回归算法推导
目录
一、广义线性模型
二、对数几率回归的广义线性建模推导过程
三、极大释然估值法
四、对数几率回归的参数估计
五、总结
指数族分布的概率密度函数指数族分布是一类分布的总称,该分该分布的分布律(或者概率密度函数)的一般形式如下
其中,称为该分布的自然参数;为充分统计量,视具体的分布而定,通常是等于随机变量本身;为分配函数;为关于随机变量的函数,常见的伯努利分布和正太分布均属于指数族分布。
伯努利分布律密度函数如下:
经过恒等变形与指数族分布一般形式对比,可得:
伯努利分布各参数因此,伯努利分布是指数族分布
广义线性模型三条假设
1、在给定的条件下,假设随机变量服从某个指数族分布;
2、在给定的条件下,我们的目标是得到一个模型能预测出的期望值;
3、假设该指数族分布中的自然参数和呈线性关系,即
凡是能通过上面三条假设构建出的模型,我们称之为“广义线性模型”。
对数几率回归的广义线性模型推导:
分析:已知是服从伯努利分布,而伯努利分布属于指数族分布,所以满足广义线性模型第一条假设,接着根据广义线性模型的第二条假设我们可以推得模型表达式为:
又因为
所以
根据伯努利分布的第三条假设得到:
,代入。至此,基于广义线性模型的三条假设建模出了对数几率回归模型。
极大似然估计法:设总体的概率密度函数(或分布律)为为从总体中抽出的样本。因为相互独立同分布,于是,它们的联合概率密度函数(或联合概率)为,其中被看作固定但是未知的参数。当我们已经观测到一组样本观测值时,要去估计未知参数,一种直观的想法就是,哪一组参数使得现在的样本观测值出现的概率最大,哪组参数可能就是真正的参数,我们就用它作为参数的估计值,这就是所谓的极大似然估计。
极大似然估计的具体方法:
通常记,并称其为似然函数。于是求的极大似然估计就归结为求的最大值点。由于对数函数是单调递增函数,所以
与 有相同的最大值点,而在许多情况下,求的最大值点比较简单,于是我们就将求的最大值点转化为求的最大值点,通常称为对数似然函数。
由公式推导可得: ,此式为关于的高阶可导连续凸函数,根据凸优化理论,可用经典的数值优化算法,如梯度下降法或牛顿法等都可求得其最优解。
总结:
本文基于广义线性模型的三条假设与伯努利分布,推导出对数几率回归模型。并使用极大似然估计求得对率模型关于的高阶凸函数。进一步可通过梯度下降法、牛顿法等对该函数求最优解。