SMOTE算法——合理样本生成器,告别样本不均衡

首先,看Smote算法之前,我们先看下当正负样本不均衡的时候,我们通常用的方法: 抽样 常规的包含过抽样、欠抽样、组合抽样 过抽样:将样本较少的一类sample补齐 欠抽样:将样本较多的一类sample压缩 组合抽样:约定一个量级N,同时进行过抽样和欠抽样,使得正负样本量和等于约定量级N        这种方法要么丢失数据信息,要么会导致较少样本共线性,存在明显缺陷 权重调整 常规的包括算法中的w
相关文章
相关标签/搜索