NLP系列 10. BERT

Transformer的原理 BERT的算法来自谷歌的另一篇论文:https://arxiv.org/abs/1706.03762 。完全抛弃了RNN、CNN,而提出了另外一种新的网络结构:Transformer。Transformer现在是谷歌云TPU推荐的参考模型。 Transformer由encoder和decoder组成,encoder、decoder分别由一些编码器和解码器构成。 编码器
相关文章
相关标签/搜索