Pointer Networks

2019-02-15  本文已影响3人  初七123

seq2seq

  1. 离散的词ID转换为词向量

与Encoder 中的这个步骤是一样的, 只不过embedding矩阵与Encoder的可能不一样,比如翻译源语言与目标语言需要使用不同的embbedding矩阵,但是如文本摘或是文本风格改写这种就可以使用同一个embedding矩阵。

  1. 由encoder的输出结合decoder的prev_hidden_state生成energy
  1. 由energy 到概率
  1. context 向量合成
  1. prev_hidden_state, 词向量, context向量通过GRU单元生成下一时刻hidden_state

Pointer Network

上一篇 下一篇

猜你喜欢

热点阅读