不同于GRU的两个门,LSTM有三个门。两者的出现时间LSTM更靠前,GRU可以看做在LSTM基础上的简化版,它更简单。
是更新门(update)、
是遗忘门(forget)、
是输出门(output),其他参数的可以类比之前写的GRU简记

LSTM各参数计算公式

LSTM单元示意图

多个LSTM单元之间的连接

网上找的LSTM单元之间的连接示意图2

上图图例
总之GRU结构更简单,因为它只有两个门,适合构建更大型的网络。LSTM具有三个门,所以更灵活,更强大。
另一篇关于LSTM很详细的一篇译文文章