【自然语言处理】 词向量

【传统的语义向量表示方法】 one-hot:每个词表示为一个很长的向量,向量的维度是词表大小,其中只有一个维度的值为1,其它元素为0. 词袋模型(BOW):将语料库中所有词语装进一个袋子里,不考虑其词法和语序的问题,即每个词语都是独立的,语料库中所有的词组成一个清单进行映射匹配。对于每一个句子或文档,其对应的下标与映射数组的下标相匹配,其值为该词语出现的次数。 例如:该例子来源于百度百科 以下是两
相关文章
相关标签/搜索