python 提取sogou中文语料库

sogou中文语料库下载地址是:https://download.csdn.net/download/kinas2u/1277550 下载下来的文件包含了很多子文件夹,每个子文件夹下又包含了很多txt语料文件,我想把他们都整合到一个txt中(./SogouC_mini_20061102/Sample),并且输出的是已经分好词的txt文件 下面是处理程序 # -*- coding: utf-8 -*
相关文章
相关标签/搜索