Distributed Representations of Words and Phrases and their Compositionality--翻译

词和短语的分布表示及其构成 原作者:Tomas Mikolov等 #摘要 最近引入的连续Skip-gram模型是学习高质量分布向量表示的有效方法,分布向量表示可以捕获大量精确的句法和语义关系。在本文中,我们提出了几个扩展,提高了向量的质量和训练速度。通过对频繁的单词进行二次抽样,我们获得了显着的加速,同时还学习了更多的常规单词表示。我们还提出了一个分层soft max的简单替代方案,称为负采样。
相关文章
相关标签/搜索