中文词向量:Word2vec 从熟悉到入门

Word2vec 也叫 Word Embeddings,中文名“词向量”,作用就是将自然语言中的字词转为计算机可以理解的稠密向量(Dense Vector)。在 Word2vec 出现之前,自然语言处理经常把字词转为离散的单独的符号,这种编码方式称为 One-Hot Encoder。 在自然语言处理领域也就是在 Bert 跟 Xlnet 模型出现以前(2019 年是 NLP 领域突飞猛进的一年,B
相关文章
相关标签/搜索