aboutDL

GRU循环序列模型简记(&RNN unit)

2019-01-23  本文已影响4人  madeirak
RNN 单元 GRU简化模型

c^{t-1}是上一时间步的状态,c^{t}是这一时间步状态,(这三个参数在吴恩达视频中又叫memory cell,取首字母),x^t是此时间步的输入,\tilde{c}^t是重写记忆细胞值c^{t-1}的候选值,\Gamma u(update)是此时间步的更新门(gate)值,tanh和\sigma 分别是激活函数tanh函数和S函数(又叫\sigma 函数),可选择将每个时间步的新的记忆细胞值通过softmax激活后输出,b_cb_u是偏移量,W_{c} W_{u} 是权重,\ast 是元素级的乘积,

    上方GRU示意图中紫色区域所执行的操作就是下方的第三个式子

GRU主要参数的计算公式

上式的参数中c^t \tilde{c}^t \Gamma u可以是向量,他们是相同维度的,这也印证了他们的元素级乘积操作\ast 由于\Gamma u是被\sigma 激活后的值,值域在[0,1],它与同纬度的向量\tilde{c} ^t进行元素级乘积后,相当于通过0和1来选择保留或更新记忆细胞的值。

更进一步,完整的GRU还需添加一个参数\Gamma r,它代表c^{t-1}(上一个时间步的记忆细胞值)和\tilde{c} ^t(此时间步的更新候选项)之间关联性

完整GRU的参数之间计算公式

GRU单元中主要的部分是两个门,分别是上面提到的\Gamma u(更新门)、\Gamma r(关联门)

上一篇下一篇

猜你喜欢

热点阅读