NLP修炼之旅(Day9)

文本表示:从one-hot到word2vec。 1.词袋模型:离散、高维、稀疏。 1.分布式表示:连续、低维、稠密。word2vec词向量原理并实践,用来表示文本 词袋模型 文本表示分为离散表示与分布式表示,其中词袋模型BoW(Bag-of-words)是n-gram语法模型的特例1元模型,该模型忽略掉文本的语法和语序等要素,将其仅仅看作是若干个词汇的集合,文档中每个单词的出现都是独立的。BoW使
相关文章
相关标签/搜索