word2vec原理超详解

1.回顾one-hot 表示的词向量 主要参考句子的向量表示,可以看下面这张图,就是用 One-hot 表示的单词或句子向量 这样表示有什么缺点?? 这是一种稀疏表示(通常词库很大,0 的个数也特别多) 无法表示单词之间的相似性,用余弦相似度计算结果都为0 表达容量差 怎么理解表达容量差呢? 我们先假设词向量的维度只有8维,如果用One-hot表示,那我们最多只能表示 8 种不同的单词,因为 1
相关文章
相关标签/搜索