[ACL2016]Pointing the Unknown Words

在很多NLP系统中,包括传统计数和深度学习模型中,稀疏词和未登录词的处理是一个很重要的问题,模型中用了两个softmaxt层用于预测条件语言模型中的next word, 其的生成有两种来源(1)原句子中的token(原句子指的是input sentence), (2)shortlist vocabulary(如果任务是机器翻译,shortlist vocabulary 是目标语言中部分词) sho
相关文章
相关标签/搜索