深度学习之——word2vec

1. 文本表示:从one-hot到word2vec 文本表示的意思是把字词处理成向量或矩阵,以便计算机能进行处理。文本表示是自然语言处理的开始环节。 文本表示按照细粒度划分,一般可分为字级别、词语级别和句子级别的文本表示。 文本表示分为离散表示和分布式表示。离散表示的代表就是词袋模型,one-hot(也叫独热编码)、TF-IDF、n-gram都可以看作是词袋模型。分布式表示也叫做词嵌入(word
相关文章
相关标签/搜索