问答部分:

2020-06-29  本文已影响0人  高斯纯牛奶

BERT不属于语言模型,因为是mask了一个词,通过上下文去预测中间的单词,所以叫DAE(denoising autoencoder,去噪声自编码器)


image.png
上一篇 下一篇

猜你喜欢

热点阅读