不同于GRU的两个门,LSTM有三个门。两者的出现时间LSTM更靠前,GRU可以看做在LSTM基础上的简化版,它更简单。
是更新门(update)、是遗忘门(forget)、是输出门(output),其他参数的可以类比之前写的GRU简记
LSTM各参数计算公式
LSTM单元示意图
多个LSTM单元之间的连接
网上找的LSTM单元之间的连接示意图2
上图图例
总之GRU结构更简单,因为它只有两个门,适合构建更大型的网络。LSTM具有三个门,所以更灵活,更强大。
另一篇关于LSTM很详细的一篇译文文章