李宏毅机器学习：Transformer

2021-08-09 本文已影响0人 jenye_

input a sequence, output a sequence

Seq2seq for Syntactic Parsing （文法分析）

Multi-class ：从多个class中选择一个
Multi-laber：一个object可以属于多个class

最早的Seq2Seq

现在的Seq2Seq

Transformer 总体来说是用到了Self-attention：

实际上的过程会复杂一些：

其实Decoder并没有特别大的差别（如果不看中间灰色部分的话）

在Decoder运作的时候，输出是一个一个产生的，所以没有办法考虑后续的信息。