Word2Vec的原理与实现

词向量表达 word2vec就是将单词嵌入到向量空间中。 独热表达: 每一个单词用不同的ID进行表示,因此可以表示为其中一个维度为1,其他全0的向量。例如: 科学院:[1,0,0] 中科院:[0,1,0] 数据挖掘:[0,0,1] 此种方法相当于将单词看成无语义的ID。在向量空间中考虑,此时单词之间相似性程度一样,不能体现出单词间的语义关系。 分布式表达 每一个单词表示为一般的向量,可以建模单词之
相关文章
相关标签/搜索