[ACL2016]Pointing the Unknown Words

时间 2021-01-02

原文原文链接

在很多NLP系统中，包括传统计数和深度学习模型中，稀疏词和未登录词的处理是一个很重要的问题，模型中用了两个softmaxt层用于预测条件语言模型中的next word, 其的生成有两种来源（1）原句子中的token(原句子指的是input sentence), (2)shortlist vocabulary(如果任务是机器翻译，shortlist vocabulary 是目标语言中部分词) sho