NLP 4

Word2Vec 将文本转为计算机可以理解的数字表达,我们在机器学习时采用的方法是TF-IDF,但TF-IDF是基于信息熵的一种统计手段,无法精准刻画词的上下文关系。Word2Vec是对基于上下文的词进行预测,在Word2Vec中,我们会设置一个中心词,以及时间窗口。根据预测的出发点和结束点的不同,分为Skip-grams方法和CBOW方法,SG方法是词为自变量,预测周围可能的词,CBOW方法是以
相关文章
相关标签/搜索