【论文阅读】RNN语言模型

2019-08-08  本文已影响0人  神游物外的轮子

Recurrent neural network based language model

提出了一种RNN语言模型,通过混合RNN模型能够在backoff模型基础上,下降50%的困惑度。
目前主流提升ngram性能的方法有两种:基于长文本信息的方法以及基于将单词分类的方法。

RNN模型

输入层x,隐层s(状态层)以及输出层y
t时刻的网络输入为x(t),输出为y(t),网络状态为s(t),单词为w(t)
\begin{align} x(t) = w(t) + s(t-1) \\ s_j(t) = f \left( \sum_ix_i(t)u_{ji} \right) \\ y_k(t) = g \left( \sum_js_j(t)v_{kj} \right) \end{align}
其中f(z)是sigmoid激活函数:
f(z) = \frac{1}{1+e^{-z}}
g(z)是softmax函数:
g(z_m) = \frac {e^{z_m}}{\sum_ke^{z_k}}

实现细节

优化

上一篇 下一篇

猜你喜欢

热点阅读