【视野提升】ChatGPT的系统是如何工作的?

413次阅读  |  发布于10月以前

类似ChatGPT的系统是如何工作的?

我们试图在下图中解释它是如何工作的。这个过程可以分为两个部分。

训练

要训练一个ChatGPT模型,有两个阶段:

预训练

在这个阶段,我们在大量互联网数据上训练一个GPT模型(仅解码器转换器)。

目标是训练一个模型,该模型可以根据给定的句子预测未来的单词,使其语法正确且语义有意义,类似于互联网数据。

在预训练阶段之后,模型可以完成给定的句子,但它不能回答问题。

微调:

这个阶段是一个三步过程,将预训练的模型转变为一个问答ChatGPT模型:

回答提示

Copyright© 2013-2020

All Rights Reserved 京ICP备2023019179号-8