Knowledge-Injected BERTs

时间 2020-12-26

标签 NLP 繁體版

原文原文链接

1 从任务本身来看，BERT本质上是一个通用的语言模型，在进行预训练时，我们希望它能够学习到词表中每个词的词向量，即对我们平时所接触到的自然语言进行编码（encode），使之转化成模型能理解的语言。这样的设定本身存在一个小问题：通过模型编码之后的语言向量，人类无法理解，那如何才能确保模型正确地学到我们希望的知识呢？一个解决方案是，我们将模型的输出映射到原来的词表中，然后将概率最大的单词作为模型的

>>阅读原文<<

1. 浅谈 Knowledge-Injected BERTs
2. 【论文读后感】Dialogue-Based Relation Extraction
3. 论文解读 | 基于正则化图神经网络的脑电情绪识别
4. 基于多域连接卷积神经网络的精神分裂症脑功能网络分类
5. JavaScript实现的游戏们
6. BERT在多模态领域中的应用
7. 抛开约束，增强模型：一行代码提升 ALBERT 表现
8. 神经网络中的常用激活函数总结
9. 你的 CRF 层的学习率可能不够大
10. 深度学习预训练模型可解释性概览
更多相关文章...