08 - 样本不均衡解决方案

背景 在进行数据分析的时候,有时候会存在这样的情况:例如判断信用卡是否存在欺诈的行为,这样的问题就是一个二分类的问题,但是对于这样的问题,存在欺诈和正常的样本是存在有很大的差距的,可能欺诈的仅仅占有百分之一都不到;对于这样的样本不均衡的情况,一般情况下可以采用两种方式进行处理:过采样、下采样 下采样 对于这种方式,通常情况下就是将样本数量多的那一方的数据量调小,使和较小样本数量一样的数量(使样本数
相关文章
相关标签/搜索