进击的AI------零碎篇

深层神经网络简单介绍(1)

2017-11-14  本文已影响14人  君植泽的简书

1/神经网络构架:

前向神经网络,典型代表CNN;循环神经网络:典型代表RNN;对称神经网络:典型代表DBN

2/常见激活函数:(激活函数不可以是线性的)

sigmoid函数,tanh函数,Relu函数https://wenku.baidu.com/view/3f14f716a76e58fafab003f1.htmlhttps://wenku.baidu.com/view/3f14f716a76e58fafab003f1.html

(各种激活函数的优缺点比较参见: https://zhuanlan.zhihu.com/p/25110450)

(Relu函数可以逼近任意函数参见: https://zhuanlan.zhihu.com/p/23186434)

3/感知机与神经网络:

可以看做线性的二分类神经网络,寻找一个超平面将正负样本分开

感知机的局限:(1)对特征工程要求过于苛刻(2)不能处理线性不可分的情况

神经网络需要解决的问题:(1)如何放宽特征要求(2)如何处理非线性可分的情况(加入隐藏层)

4/神经网络的BP算法:

参见:    https://wenku.baidu.com/view/3f14f716a76e58fafab003f1.html

(上述链接可以作为一个参考)

关于BP算法的解释参见:   https://www.zhihu.com/question/24827633

5/神经网络的参数和超参数:

参数: 权重w ,偏移b

超参数:(1). 学习率η,(2). 正则化参数λ,(3). 神经网络的层数L,(4). 每一个隐层中神经元的个数j,(5). 学习的回合数Epoch,(6). 小批量数据minibatch的大小,(7). 输出神经元的编码方式,(8). 代价函数的选择,(9). 权重初始化的方法,(10). 神经元激活函数的种类,(11).参加训练模型数据的规模

上一篇 下一篇

猜你喜欢

热点阅读