word2vec模型原理(一)：基于哈夫曼树的word2vec

时间 2020-12-23

原文原文链接

在nlp领域，文本词的向量表示往往是第一步，笔者在做一些推荐相关性的工作中也用到了其中很常见的word2vec模型，因此也具体学习了一下word2vec的具体实现原理，本文主要参考了github开源的c语言版的word2vec源码以及相关的博客。一、要解决的问题对于语料中的每一个词，最简单的表达方式就是one-hot，即利用位数编码的方式每个词占据一个“1”位，其余为0,。这

>>阅读原文<<