GPT 原理解析

本文首发于我的个人博客 Sui Xin’s Blog 原文:https://suixinblog.cn/2019/09/gpt.html 作者:Sui Xin GPT(Generative Pre-Training)是一个典型的两阶段式模型:无监督预训练+监督下游任务微调。而在 NLP 任务中,上游的无监督预训练任务多半采用语言模型来实现,下游的监督任务直接对上游的模型进行简单改造即可使用。 GP
相关文章
相关标签/搜索