逻辑回归

2019-05-13  本文已影响0人  MaskStar

逻辑回归是假设数据服从伯努利分布(二项分布),通过极大似然函数的方法,运用梯度下降来求解参数,达到数据的二分类的目的。
是经典的二分类算法,是处理因变量是分类变量的回归问题。

1.1 对数几率回归

线性模型是回归问题,如果要处理分类问题的话,该如何?
答案在广义线性模型中,只需要找一个单调可微函数将分类任务的真实标记y与线性回归模型的预测值联系起来,
二分类,其输出标记为 y={0或1},而线性回归产生的预测值z = w^Tx+b,我们只需将实值z转换为0,1值就可以了。最理想的是“单位阶跃函数”,即:

单位阶跃函数
单位阶跃函数对数几率函数如下所示:
单位阶跃函数和对数几率函数
预测值大于0,则判定为正例;小于0,则判定为负例;为0,则可以任意定义。
由于单位阶跃函数不连续所以不能直接定义为线性回归的函数。所以我们希望找到能在一定程度上近似单位阶跃函数的“替代函数”,并且单调可微,所以就找到了对数几率函数
对数几率函数
对数几率函数是一种“Sigmoid函数”,将其代入线性回归有:

将上式变换得:

将视为作为正例的相对可能性,则是其反例的可能性,两者的比值称为“几率”,反映了作为正例的相对可能性,对几率取对数则得到“对数几率”。
1.2极大似然求解

如何求解wb呢?我们可以将y视为后验概率估计p(y=1|x)
则上式变换为 ln(\frac{p(y=1|x)}{p(y=0|x)}=w^Tx+b)
得:
p(y=1|x)=\frac{e^{w^Tx+b}}{1+e^{w^Tx+b}}
p(y=0|x)=\frac{1}{1+e^{w^Tx+b}}
于是可以通过极大似然法来估计wb

令:
最大似然函数

则目标函数可写为:


对数几率回归的目标函数
对目标函数求解得到最优参数。
上一篇下一篇

猜你喜欢

热点阅读