数据挖掘篇: 使用决策树识别Python招聘信息所属类别(分支)

最近在分析Python招聘信息的数据, 使用职位描述分词来判断分类不是很精准, 于是打算使用分词构造一个特征, 然后使用决策树来分类(下次试试聚类算法), 这样误差会小很对, 可以让我们更加精准的完成一份高质量的数据报告. 首先看看原始数据吧 接下来我们要通过分词和人工识别来构建专家样本数据 注: 原计划训练数据至少2000条, 然后先人工识别了100条就忍不住想试一试 由于有20个特征和4个分类
相关文章
相关标签/搜索