word2vec详解

在NLP领域里,将一个单词用一个有限维的向量表示基本上已经成为现在进行文本处理的一个标配步骤。在word2vec这个神器出现以前,比较通用的解决步骤是WordNet,可以认为它是一个类似词典一样的存在,查每个词对应的同义词、上位词等信息,好虽好,但是需要人工维护,而且缺乏对词语新的含义的挖掘,不能做到实时更新,虽然能够找到一个词的同义词,但是词之间的相似度到底有多高这个指标很难度量。传统one-h
相关文章
相关标签/搜索