Levenberg-Maquardt Algorithm 推导

2019-01-06  本文已影响0人  MadCoder

前置知识

1. 牛顿法

作用:1. 求根 2.求极值

  1. 求根

    目标: 求解 f(y)=0 的根

    计算穿过初始点(x_0,f(x_0)) 并且斜率为 f'(x) 的直线与x轴的交点可得

    0=(x-x_0)f'(x_0)+f(x_0)

    迭代公式: x_{n+1}=x_n-\frac{f(x_n)}{f'(x_{n})}

  2. 求解一维无约束最小值

    目标: 求解 min f(x) , x\in R 的根

    牛顿法也可用来求解函数的极值。极值点是导数为0,可用牛顿法求导数的零点。

    f(x+\Delta) 的二阶泰勒展开为 f(x+\Delta)=f(x)+f'(x)\Delta+\frac{1}{2}f''(x)\Delta^2

    求解 \frac{\partial f(x+\Delta)}{ \partial \Delta}=0

    可得 f'(x)+f''(x)\Delta=0
    \Delta=-\frac{f'(x_n)}{f''(x_{n})}

    迭代公式: x_{n+1}=x_n-\frac{f'(x_n)}{f''(x_{n})}

  3. 求解高维无约束最小值

    高维情况下泰勒二阶展开为

    f(\mathbf x+\mathbf \Delta)=f(\mathbf x)+\nabla f(\mathbf x)\Delta+\frac{1}{2}\Delta ^TH(f(\mathbf x))\Delta

    因此迭代公式:x_{n+1}=x_n-[H(f(x_n))]^{-1}\nabla f(x)

优点

缺点

2. 高斯-牛顿法

作用:降低牛顿法的计算量,提高计算效率

最小二乘法问题

对于向量函数 {\bf f}:R^m\to R^n,m\ge n

最小化 ||f(x)|| 或者找到 x^*=argmin_x\{F(x)\}

这里 F(x)=\frac{1}{2}\sum_{i=1}^m(f_i(x))^2=\frac{1}{2}{\bf f}({\bf x})^T{\bf f}({\bf x})

牛顿法推导

已知牛顿法迭代公式: x_{n+1}=x_n-[H(f(x_n))]^{-1}\nabla f(x)

F(x) 的梯度 \nabla F(x)=\begin{bmatrix}\frac{\partial (\frac{1}{2}\sum_{i=1}^m(f_i(x))^2)}{\partial x_1}\\\vdots\\\frac{\partial (\frac{1}{2}\sum_{i=1}^m(f_i(x))^2)}{\partial x_n}\end{bmatrix}=\begin{bmatrix}\sum_{i=1}^{m}f_i\frac{\partial f_i}{\partial x_1}\\\vdots\\\sum_{i=1}^{m}f_i\frac{\partial f_i}{\partial x_n} \end{bmatrix}= \begin{bmatrix} \frac{\partial f_1}{\partial x_1} & \cdots & \frac{\partial f_1}{\partial x_n} \\ \vdots & \ddots & \vdots \\ \frac{\partial f_m}{\partial x_1} & \cdots & \frac{\partial f_m}{\partial x_n} \end{bmatrix}^T\begin{bmatrix}f_1 \\ \vdots \\ f_m \end{bmatrix}

\nabla F(x)=J_f^Tf

Hessian 矩阵有 H_{jk}=\sum_{i=1}^m(\frac{\partial f_i}{\partial x_j}\frac{\partial f_i}{\partial x_k}+f_i\frac{\partial ^2f_i}{\partial x_j\partial x_k})

忽略二阶导数项有: H_{jk}\approx \sum_{i=1}^mJ_{ij}J_{ik}

所以: H\approx J_f^TJ_f

高斯-牛顿迭代公式: x_{n+1}=x_n-[J_f^TJ_f]^{-1}J_f^Tf(x_n) s.t. |\frac{\partial f_i}{\partial x_j}\frac{\partial f_i}{\partial x_k}|\gg |f_i\frac{\partial ^2f_i}{\partial x_j\partial x_k}|

优点

缺点


Levenberg-Maquardt 算法

根据目标函数F(x) 二阶近似得到:

F(x+h)\approx F( x)+\nabla F(x)h+\frac{1}{2}h^TH_Fh\approx F( x)+J_f^Tfh+\frac{1}{2}h^TJ_f^TJ_fh

我们定义下降方向为 L(h)

L(h)\equiv F( x)+J_f^Tfh+\frac{1}{2}h^TJ_f^TJ_fh​ S.T. h = x_{n+1} - x_n= \Delta ​

高斯牛顿法迭代公式:
x_{n+1}=x_n-[J_f^TJ_f]^{-1}J_f^Tf(x_n)

LM迭代公式: x_{n+1}=x_n-[J_f^TJ_f+\mu I]^{-1}J_f^Tf(x_n)
or
[J_f^TJ_f+\mu I]h=-J_f^Tf(x_n)

作用:结合了高斯牛顿法与梯度下降法的特点,引入阻尼因子来调节算法特性。

因子作用

\mu的计算

if\,\varrho>0\,\mu =\mu * max\{\frac{1}{3},1-(2\varrho-1)^3\}\\else\,\mu =\mu * v;v=2

u 和 p 关系曲线图

\mu\varrho 关系曲线图

LM算法流程图

LM算法流程图

Reference

上一篇 下一篇

猜你喜欢

热点阅读