Bert

时间 2021-06-22

标签深度学习自然语言处理繁體版

原文原文链接

每个block的参数不共享，独立学习介绍了Transformer，下一个就是Bert，一个巨大成功的预训练模型，上图 Bert全名为Bidirectional Encoder Representations from Transformers，E1...En是单个字或者词，大部分都是字为单位，Trm是一个transformer，T1...Tn是最终计算的隐藏层。因为再注意力矩阵中每个词都能学习到

>>阅读原文<<

1. BERT家族：sentence-BERT
2. BERT家族：K-BERT
3. BERT家族：BERT-WWM
4. BERT
5. bert
6. BERT家族：族长BERT
7. BERT 服务化 bert-as-service
8. NLP---BERT
9. Task10 BERT
10. Transformer & Bert
更多相关文章...