Word2Vec的原理与实现

时间 2020-12-30

原文原文链接

词向量表达 word2vec就是将单词嵌入到向量空间中。独热表达：每一个单词用不同的ID进行表示，因此可以表示为其中一个维度为1，其他全0的向量。例如：科学院：[1,0,0] 中科院：[0,1,0] 数据挖掘：[0,0,1] 此种方法相当于将单词看成无语义的ID。在向量空间中考虑，此时单词之间相似性程度一样，不能体现出单词间的语义关系。分布式表达每一个单词表示为一般的向量，可以建模单词之

>>阅读原文<<