Spark MLlib 特征抽取、转化和选择 -- 特征抽取2 Word2Vec

这一部分主要介绍和特征处理相关的算法,大体分为以下三类: 1)特征抽取:从原始数据中抽取特征 2)特征转换:特征的维度、特征的转化、特征的修改 3)特征选取:从大规模特征集中选取一个子集 特征提取: Word2Vec Word2Vec是一种著名的词嵌入(Word Embedding)方法,是google在2013年推出的一个NLP工具,他可以计算每个单词在其给定的语料库环境下的分布式词向量(Dis
相关文章
相关标签/搜索