随笔-生活工作点滴工作生活

残差层

2019-07-04  本文已影响0人  LuDon

引言

在VGG中,随着网络层数的增多,往往伴随着以下几个问题:

从信息论的角度来看,由于DPI(数据处理不等式)的存在,在前向传输的过程中,随着层数的加深,特征图包含的图像信息会越来越少,而resnet的直接映射的加入,保证了l+1层的网络包含的信息一定比第l层的多。

残差网络

残差块

残差块的结构如下图所示。


一个残差块可以表示为:

由两个部分组成:直接映射和残差部分。
对于残差块更一般的表示:

对于假设1,假设h(x_l) = \lambda_{l} x_l,则残差块可以表示为:
x_{l+1}= \lambda_{l} x_l + F(x_l, W_l)
对于更深的层
x_L = (\prod_{i=l}^{L-1} \lambda_l)x_l + \sum_{i=l}^{L-1}(\prod_{i=l}^{L-1} \lambda_l)F(x_l, W_l)
现只考虑公式的左半部分:
\frac{dloss}{dx_l} = \frac{dloss}{dx_L} (\prod_{i=l}^{L-1} \lambda_i)

上一篇下一篇

猜你喜欢

热点阅读