文献阅读笔记electra: pre-training text encoders as discriminators rather than generators

目录 0. 背景 0.1 摘要 1. 介绍 2. 方法 3. 实验 3.1 实验设置 3.2 模型拓展 3.3 Small版模型 3.4 Large版模型 3.5 有效性分析 4. 总结 0. 背景 机构:斯坦福、Google Brain 作者:Kevin Clark、Minh-Thang Luong、Quoc V. Le 论文地址:https://arxiv.org/abs/2003.10555
相关文章
相关标签/搜索