Word2Vec学习笔记

这周开始学习word2vec,现在把网课相关内容整理如下: 1、词向量模型 以前统计文本,基本上基于词频,或者TFIDF,面临两个问题:1)两个词调换顺序,但是词频等不变,即改变位置不会影响计算结果;2)词义相近,但会出现截然不同的结果(自然语言处理与NLP被认为是两个词),其实有些词的词义是一致的,在空间上或是向量层面上的表达应该是一致的。 一个词向量的维度通常都是较高的,基本上是50-300维
相关文章
相关标签/搜索