chatGPT 技术分析

2023-03-03  本文已影响0人  gone11

chatGPT 相关关键词

chatGPT的起源 --- Transformer 系列的发展变化

深度学习发展历史.png Transformer发展历史.png

图中,Transformer 有3个分支,GPT, T5, BERT。GPT 是一种单向(从左往右)预测下文概率算法,BERT是双向(上下文)预测下文的算法, 前几年因为BERT的双向预测,精度一直比GPT好。但OpenAI 一直坚持走单向的路线,经过3年的迭代,出现突破性的进展。

chatGPT 发展历史

GPT是一种自然语言处理模型,使用多层变换器(Transformer)来预测下一个单词的概率,通过训练在语料库上学习的语言模式来生成自然语言, GPT这样的自回归式生成模型,也就是大家常见的“续写”模型。

ChatGPT写一篇文章时,它是一遍又一遍地问“鉴于到目前为止的文本,下一个单词应该是什么?”
如:

the best thing about AI
the best thing about AI is
the best thing about Ai is its
the best thing about Ai is its ability
....

其家族的发展历史

chatGPT 核心算法

chatGPT 采用三段式的训练方法:


三段式训练.jpg
  1. 收集演示数据,训练监督模型
  2. 收集对比数据,训练奖励模型
  3. 用PPO强化学习算法优化奖励模型

以下是chatGPT成功的原因:

chatGPT 核心算法: RLHF算法,以下是过程:

上一篇 下一篇

猜你喜欢

热点阅读