神经网络和深度学习 - Chapter6 优化算法

2021-09-22  本文已影响0人  nlpming

Batch vs Mini-batch 梯度下降算法

batch vs min-batch梯度下降法.png
Mini-batch梯度下降法.png

随机梯度下降法 vs 批梯度下降法 vs Mini-batch梯度下降法

image.png
image.png

指数加权平均

image.png

动量法(Momentum)

Momentum优化算法.png

RMSprop优化算法

RMSprop优化算法.png

Adam优化算法

Adam优化算法.png

学习率衰减

\alpha = \frac{1}{1 + decay\_rate * epoch \_num} \times \alpha_0
\alpha = 0.95^{epoch\_num} \times \alpha_0

学习率衰减.png
image.png 带warmup的学习率衰减策略.png

深度学习中局部最优值问题

鞍点问题
平原问题.png
上一篇下一篇

猜你喜欢

热点阅读