李宏毅nlp学习笔记05：BERT

时间 2021-08-15

标签 nlp视频笔记繁體版

原文原文链接

1.Context Vector（考虑上下文关系的向量）： 2.self-supervised learning（自监督学习）： 3.预测下一个token：需要注意的是，输入w1来预测出w2的时候，是不能同时把w2输入的，很显然的。否则模型直接训练为与下一个输入相同即可。通过h1来得出输出为w1的方法，上图中的右侧为一种方法。最早的使用的model 是一个LSTM：现在一般使用的是self

>>阅读原文<<

1. 李宏毅nlp学习笔记14：Multi-lingual BERT
2. 李宏毅-ELMO, BERT, GPT讲解笔记
3. 李宏毅-ELMO、BERT、GPT视频笔记
4. 台大李宏毅机器学习—学习笔记05
5. 李宏毅nlp学习笔记04：bert和它的好朋友们
6. ELMO、BERT、ERINE、GPT的李宏毅视频学习笔记
7. 李宏毅-ELMO, BERT, GPT
8. 李宏毅nlp学习笔记12：DST（Dialogue State Tracking）
9. 李宏毅nlp学习笔记13：GPT-3
10. 李宏毅nlp学习笔记09：Dependency parsing
更多相关文章...
• 您已经学习了 XML Schema，下一步学习什么呢？ - XML Schema 教程
• 我们已经学习了 SQL，下一步学习什么呢？ - SQL 教程
• Tomcat学习笔记（史上最全tomcat学习笔记）
• 适用于PHP初学者的学习线路和建议

最新文章

1. 正确理解商业智能 BI 的价值所在
2. 解决梯度消失梯度爆炸强力推荐的一个算法-----LSTM（长短时记忆神经网络）
3. 解决梯度消失梯度爆炸强力推荐的一个算法-----GRU（门控循环神经⽹络）
4. HDU4565
5. 算概率投硬币
6. 密码算法特性
7. DICOMRT-DiTools：clouddicom源码解析(1)
8. HDU-6128
9. 计算机网络知识点详解（持续更新...）
10. hods2896(AC自动机）

本站公众号

欢迎关注本站公众号,获取更多信息

1. 李宏毅nlp学习笔记14：Multi-lingual BERT
2. 李宏毅-ELMO, BERT, GPT讲解笔记
3. 李宏毅-ELMO、BERT、GPT视频笔记
4. 台大李宏毅机器学习—学习笔记05
5. 李宏毅nlp学习笔记04：bert和它的好朋友们
6. ELMO、BERT、ERINE、GPT的李宏毅视频学习笔记
7. 李宏毅-ELMO, BERT, GPT
8. 李宏毅nlp学习笔记12：DST（Dialogue State Tracking）
9. 李宏毅nlp学习笔记13：GPT-3
10. 李宏毅nlp学习笔记09：Dependency parsing

>>更多相关文章<<