doc2vec的深入研究以及实验探索(一)

1.doc2vec的基本原理       doc2vec运用了基于神经网络概率语言模型的自然语言处理技术,其处理过程是:先对足够丰富的语料库中的语料进行分词,形成语料库词典,然后利用神经网络概率语言模型进行语料的训练,最后为词典中的每个词形成一个多维(一般50-100维)的词向量,而通过计算这些词向量,就反映了词向量对应的词的关系,并且进一步扩展到文本的对应关系上。       word2vec词
相关文章
相关标签/搜索