wiki百科上中文语料的Word2vec实验 Python2.7 Windows环境下

准备阶段: 1.Python2.7 2.gensim模块下载,在dos窗口下执行pip install gensim 开始阶段: 1.从维基百科下载语料,大概1.45G左右https://dumps.wikimedia.org/zhwiki/latest/zhwiki-latest-pages-articles.xml.bz2  将**.xml.bz2文件转换为txt文档 代码如下 # -*- c
相关文章
相关标签/搜索