深度学习

2020自然语言处理 ElMo 模型

2020-03-17  本文已影响0人  zidea
elmo

问题

每一个句子都出现 bankbank 他们是不同 token 但是同一 type。过去只要 type 一样的,他们 word embedding 就是一样。希望机器给不同意思 token 给出不用 word Embedding. 如何认为参与添加 type 这样做起来???。

目标

ELMo(Embeddings from Language Model)

ELMo 是基于 RNN 的语言模型


elmo.jpeg

这个 RNN 模型就是预测下一个词,学习完之后我们就具有上下文的词嵌入。现在同一个词如果上下文不同输出词向量就不同。随意是相同 token 但是因为之前词汇不同。

ELMo 通常可以叠很多层神经网络,每一层都有输出,在 ELMo 模型会把每一个层输出都组合起来进行输出。
这里\alpha_1\alpha_2 参数取值是和接下来使用词向量要做的任务相关,不同任务 \alpha_1\alpha_2 取值也会不同,所以 \alpha_1\alpha_2 作为接下来模型参数一部分被学出来。

横坐标为要做的语言任务,而纵坐标表示对每一个层权重的大小

任务分类

上一篇下一篇

猜你喜欢

热点阅读