中文维基百科数据处理

导读 最近在作词向量相关工做,词向量的训练数据采用中文维基百科数据,训练以前,要对维基百科数据进行处理,这篇文章记录了一些处理过程及相关的脚本。 一 、维基百科 维基百科(Wikipedia),是一个基于维基技术的多语言百科全书协做计划,也是一部用不一样语言写成的网络百科全书。维基百科是由吉米·威尔士与拉里·桑格两人合做建立的,于2001年1月13日在互联网上推出网站服务,并在2001年1月15日
相关文章
相关标签/搜索