【重要】搜狗新闻语料库,构建Word2Vec中文词向量

具体请见: http://www.javashuo.com/article/p-rylmmcle-eq.html   一、中文语料库 本文采用的是搜狗实验室的搜狗新闻语料库,数据链接 http://www.sogou.com/labs/resource/cs.php 下载下来的文件名为: news_sohusite_xml.full.tar.gz 二、数据预处理 2.1 解压并查看原始数据 cd
相关文章
相关标签/搜索