长短记忆神经网络

2020-04-30  本文已影响0人  JLGao的简书
长短记忆神经网络定义

长短记忆神经网络(Long-short term memory, LSTM)是一种特殊的RNN结构。该神经网络可以有效保留历史信息,实现对文本的长期依赖信息进行学习。

关键问题:控制长期状态信息
图1. 长期状态信息 C 的控制
解决方法:门控开关

门的定义:使用门(Gate)实现对图1中开关的控制。所谓的门,即全连接层的一个神经元,如图2所示。门的激活有两种形式:sigmodtanh

图2. sigmod或tanh激活单元

门控实现:LSTM网络由输入门(input \ gate)、遗忘门(forget \ gate)、输出门(output \ gate)和一个记忆单元(cell)来实现历史信息的更新和保留,如图3所示。

图3. LSTM记忆单元
上一篇 下一篇

猜你喜欢

热点阅读