使用spark mllib 随机森林算法对文本进行多分类

一、数据准备 20W人工标注文本数据,样本以下:css 1#k-v#*亮亮爱宠*波波宠物指甲钳指甲剪附送锉刀适用小型犬及猫特价 1#k-v#*顺丰包邮*宠物药品圣马利诺PowerIgG免疫力球蛋白犬猫细小病毒 1#k-v#*包邮*法国罗斯蔓草本精华宠物浴液薰衣草护色润泽香波拍套餐 1#k-v#*包邮*家朵102宠物沐浴液 1#k-v#*包邮*家朵102宠物沐浴液猫 二、分词 使用ansj包对文本数
相关文章
相关标签/搜索