python调用jieba(结巴)分词 加入自定义词典和去停用词功能

转自:http://www.cnblogs.com/zhangtianyuan/p/6875080.htmlhtml 把语料从数据库提取出来之后就要进行分词啦,我是在linux环境下作的,先把jieba安装好,而后找到内容是build jieba PKG-INFO setup.py test的那个文件夹(我这边是jieba-0.38),把本身的自定义词典(选用,目的是为了分出原始词库中没有的词以及
相关文章
相关标签/搜索