词和短语的分布式表示及其组合性——论文阅读

简介 这篇文章是Word2Vec的作者,主要工作: 1. 提出skip-gram模型的扩展。如通过对高频词的二次取样(Subsampling)以提高高频词词向量的训练速度(2-10倍)和较低频词的词向量表示的质量; skip-gram模型:学习高质量分布式向量表示的有效方法,可以捕获大量准确的句法和语义关系。 2. 提出了简化的噪声对比估计变体(simplified variant of Nois
相关文章
相关标签/搜索