使用中文wiki语料库训练word2vec

1. 任务描述 本文主要完成如下任务:git 训练字的embedding(unigram char embedding) 训练二元字的embedding(bigram char embedding) 训练词的embedding(word embedding) 2. 准备工做 2.1 语料准备 下载当前最新打包的中文(简体)wiki的文本语料。 github 2.2 训练工具 本文使用Python进
相关文章
相关标签/搜索