NLP——12.词向量及相关应用

表示人类造出的词: (1)从语料中提取出含义表达。 (2)从文字到数值向量 词编码的方式:N-gram,TF-IDF——Word2vec(对于多义词会转化到同一个数值向量,从而导致不准确)——sense2vec(区分在不同语境下某些单词的具体含义) · 给每个词一个索引,每个词都编码一个下标,但是由于词与词之间有一些隐含的关系,这样做会破坏这个关系。近义词,同一类。 绘制到一个二维空间中,希望保证
相关文章
相关标签/搜索