LSTM学习笔记

2017-07-22  本文已影响0人  nichengd

SimpleRNN

当一个人说他使用RNN时基本上就是指在使用LSTM,其实LSTM是RNN的一种,所以我先从最简单的RNN看起。

RNN 的用途

RNN主要用于处理序列数据,比如语音、文本等等。

RNN结构

传统的神经网络模型中,是从输入层到隐含层再到输出层,层与层之间是全连接的,每层之间的节点是无连接的。但是这种普通的神经网络对于很多问题却无能无力。NNs之所以称为循环神经网路,即一个序列当前的输出与前面的输出也有关。具体的表现形式为网络会对前面的信息进行记忆并应用于当前输出的计算中,即隐藏层之间的节点不再无连接而是有连接的,并且隐藏层的输入不仅包括输入层的输出还包括上一时刻隐藏层的输出。

RNN结构

上图将循环神经网络进行展开成一个全神经网络。例如,对一个包含5个单词的语句,那么展开的网络便是一个五层的神经网络,每一层代表一个单词。对于该网络的计算过程如下:

循环部分可以是任意结构的神经网络

RNN求解过程推导

正向计算

RNNunfold

误差传递

RNN节点内部连接 第t层的误差可以定义为 ,p是训练样本的index。整个网络的误差

矩阵向量化表示



所以梯度为:

LSTM

实际的训练过程中RNN比较难训练,会出现梯度爆炸和梯度消失的问题。但是LSTM可以解决梯度消失的问题,这也是为什么讲RNN替换成LSTM。


LSTM结构
上一篇 下一篇

猜你喜欢

热点阅读