word2vec 的CBOW,多层softmax,负采样。

NNLM的原理基于N-1个词来预测第N个词,而CBOW是希望用前后N个词来预测中间词,这是CBOW与NNLM的本质区别。 NNLM中存在投影层,将ONE-HOT编码与词库矩阵C进行运算投射,从词库矩阵取出一列。同时对每个词取出的每个列,进行一个concat拼接。 而由于当词库非常巨大时,这个计算是非常耗费时间的。因此,就出现了CBOW CBOW CBOW将矩阵C直接舍弃,直接把这样一句话中的每个词
相关文章
相关标签/搜索