Datawhale零基础入门NLP赛事 - Task5 基于深度学习的文本分类2-1Word2Vec

时间 2021-07-11

原文原文链接

使用gensim训练word2vec gensim简介 1.1 Gensim Gensim是一款开源的第三方Python工具包，用于从原始的非结构化的文本中，无监督地学习到文本隐层的主题向量表达。它支持包括TF-IDF，LSA，LDA，和word2vec在内的多种主题模型算法，支持流式训练，并提供了诸如相似度计算，信息检索等一些常用任务的API接口。 1.2 基本概念 1.2.1 语料（Cor

>>阅读原文<<