如何使用中文维基百科语料

前言 在作天然语言处理时不少时候都会须要中文语料库,高质量的中文语料库较难找,维基百科和百度百科算是比较不错的语料库。其中维基百科会定时将语料库打包发布 https://dumps.wikimedia.org/zhwiki/ ,能够下载最新版本的语料库。而百度百科则须要本身去爬,不过也有人把爬好的语料贡献出来了,https://pan.baidu.com/share/init?surl=i3wvf
相关文章
相关标签/搜索