NLP学习04_词向量、句子向量、倒排表

词向量 欧式距离和余弦相似度的方法是无法表达单词之间的语义相似度 归为one-hot方式无法表达单词间的语义相似度 one-hot的表达方式,如果词典大小是指数级的,那么一个句子的向量表示中,只有少数位置是1,其他位置都是0 这就导致了向量稀疏 归结one-hot缺点:1、无法表达语义相似度,2、稀疏问题 词向量表示法 分布式表示法 每个单词表示的向量维度不再是等于词典长度,而是自定义的 向量中每
相关文章
相关标签/搜索