GPT-2解读(论文 + TensorFlow实现)

GPT-2是对GPT的一个升级,而且更着重于将思路放在为什么pretrain是有用的上面,认为LM自己是一个Multi-task Learner,而且大力用ZSL实验来佐证这个思路。html 文章目录 一. 前言 二. GPT-2原理 1. 数据集 2. 输入表征 3. 模型 三. 实验 四. TensorFlow实现 1. 模型结构 2. 文本续写 五. 总结 优点 不足 传送门 一. 前言 G
相关文章
相关标签/搜索