GPT3 阅读笔记

2020-07-28  本文已影响0人  nonstopfor

Language Models are Few-Shot Learners

核心思想:meta-learning
不需要fine-tune调整模型参数
三种setting直接进行测试:

模型结构上与GPT2几乎完全一样,除了attention改为了sparse的形式

上一篇 下一篇

猜你喜欢

热点阅读