天然语言处理-使用Gensim库构造中文维基百度数据词向量模型

时间 2020-06-29

标签天然语言处理使用 gensim 构造中文维基百度数据向量模型繁體版

原文原文链接

文章目录使用Gensim库构造中文维基百度数据词向量word2vec模型 1. 数据获取 2.xml格式转txt格式 process.py 在cmd中当前目录执行命令： 3. 查看数据，转换为简体数据格式(工具) 4. 文档按行分词保存成文件 TestJieba.py 5. 模型构建 word2vec_model.py 6. 测试文本类似度 testModel.py jupyter 进行跑代码

>>阅读原文<<