如何处理不平衡数据

采样法 过采样和欠采样 过采样:过拟合(学习到小类别样本中的噪声) 欠采样:欠拟合(丢失大类别样本中的重要数据) SMOTE算法 找到小类别样本中的k个近邻,然后在他们之间的连线上取点,作为新的样本。 缺点:容易过拟合 Borderline-SMOTE 其与SMOTE的不同是:SMOTE是对每一个minority样本产生综合新样本,而Borderline-SMOTE仅对靠近边界的minority样
相关文章
相关标签/搜索