维基百科镜像处理

维基百科语料资源丰富,而维基百科又提供数据库下载,是语料资源来源的良好途径。html 1. 中文维基数据下载python 下载dump:https://dumps.wikimedia.org/zhwiki/latest/,维基数据主要包含如下几部分sql zhwiki-latest-pages-articles.xml.bz2           词条正文 zhwiki-latest-redire
相关文章
相关标签/搜索