GRU循环序列模型简记(&RNN unit)
2019-01-23 本文已影响4人
madeirak
![](https://img.haomeiwen.com/i13931179/a8d42c772b85fd4f.png)
![](https://img.haomeiwen.com/i13931179/34e7bd2f4850f899.png)
是上一时间步的状态,
是这一时间步状态,(这三个参数在吴恩达视频中又叫memory cell,取首字母),
是此时间步的输入,
是重写记忆细胞值
的候选值,
(update)是此时间步的更新门(gate)值,tanh和
分别是激活函数tanh函数和S函数(又叫
函数),可选择将每个时间步的新的记忆细胞值通过softmax激活后输出,
、
是偏移量,
、
是权重,
是元素级的乘积,
上方GRU示意图中紫色区域所执行的操作就是下方的第三个式子
![](https://img.haomeiwen.com/i13931179/07363aca62fad63c.png)
上式的参数中
、
、
可以是向量,他们是相同维度的,这也印证了他们的元素级乘积操作
。由于
是被
激活后的值,值域在[0,1],它与同纬度的向量
进行元素级乘积后,相当于通过0和1来选择保留或更新记忆细胞的值。
更进一步,完整的GRU还需添加一个参数
,它代表
(上一个时间步的记忆细胞值)和
(此时间步的更新候选项)之间关联性
![](https://img.haomeiwen.com/i13931179/ca35a16e5ccb3051.png)
GRU单元中主要的部分是两个门,分别是上面提到的
(更新门)、
(关联门)