Word2Vec理解

记录词语的一种分布式表示方法word2vec,论文Distributed Representations of Sentences and Documents,其中有两种常用的无监督模型CBOW和Skip-gram,大同小异,但思想其实是有监督的。关键在于似然函数的构造和训练的加速。 一、CBOW 已知当前词的上下文来预测当前词,如图 Huffman树:带权路径长度最短的树,又称最优二叉树; 为什
相关文章
相关标签/搜索