训练神经网络

2019-05-21  本文已影响0人  autisticBoy

(在听课时做的一些笔记,本人菜鸡)

激活函数

1.sigmoid

2.RELU函数

3.LeakyReLu

建议:

数据预处理

1.zero-centring

2. normalize data

建议

在做视觉时用第一个不用第二个

weight initialization

1. small random number

建议

使用xaviier initialization 即 W = np.random.randn(fan_in, fan_out) / np.sqrt(fan_in / 2) (/2 目的是

batch normalization

优化算法

SGD(随机梯度下降法)

改进:SGD+momentum

image.png

rho为摩擦系数 一般为0.9或者0.99
速度一般初始化为0

RMSProp

image.png

先平方在去除的原因是让变化小的dimension加速,让变化大的dimension减速

Adam

结合前两种


image.png

这个有问题就是在前几项的时候secoond_moment会很小,导致前几步过于大,但是这个过大不是因为本身的梯度问题而是认为导致

Adam改进

image.png

解决了上述问题,这个算法应该是最先应该被考虑的

正则化

L2 regularization

image.png

dropout

data augmentation

对数据进行处理,如对图片进行水平翻转,标签不变

上一篇下一篇

猜你喜欢

热点阅读