Logistic回归,类别样本不均衡

不平衡数据的出现场景 搜索引擎的点击预测:点击的网页往往占据很小的比例 电子商务领域的商品推荐:推荐的商品被购买的比例很低 信用卡欺诈检测 网络攻击识别   解决方案 从数据的角度:抽样,从而使得不同类别的数据相对均衡 从算法的角度:考虑不同误分类情况代价的差异性对算法进行优化   抽样 随机欠抽样:从多数类中随机选择少量样本再合并原有少数类样本作为新的训练数据集 有放回抽样 无放回抽样 会造成一
相关文章
相关标签/搜索