天然语言处理-使用Gensim库构造中文维基百度数据词向量模型

文章目录 使用Gensim库构造中文维基百度数据词向量word2vec模型 1. 数据获取 2.xml格式转txt格式 process.py 在cmd中当前目录执行命令: 3. 查看数据,转换为简体数据格式(工具) 4. 文档按行分词保存成文件 TestJieba.py 5. 模型构建 word2vec_model.py 6. 测试文本类似度 testModel.py jupyter 进行跑代码
相关文章
相关标签/搜索