CS224n课程笔记(二)——词向量表示:word2vec

一、词义表示 在计算机中,我们如何去表示一个单词呢?在传统的NLP算法中,我们将单词表示为离散的符号,那么这些单词就可以用one-hot向量来表示。在向量的某一位置为1,其余位置为0。这样的向量会非常长。 那么这样表示的问题在于它没有给出词汇之间的内在关系。单词向量之间是互相垂直的,我们没有办法计算它们之间的相似性。 那么我们要怎么做呢?这里我们要用到NLP中一个概念:分布相似性。分布相似性就是指
相关文章
相关标签/搜索