交通事故文本多分类——做一个快乐的调包侠

jieba+word2vec+GDBT+oneVsRestClassifier 一、背景 经过俩天的数据处理,现在勉强得到了1k+条事故描述-事故原因这种格式的数据,剩下的未处理的数据同组的小伙伴们还在加班加点的做,为了不浪费时间,今天就先搭个壳子出来,看看初步效果。 二、数据预处理 和之前俩篇文章一样,采取去停用词、分词、句子向量化等操作。 #导包 import numpy as np impo
相关文章
相关标签/搜索