机器学习过程中数据不平衡问题的处理方法

        这是我今天遇到的一个问题,也是机器学习中一个比较典型的问题,问题是这样的,我拿到了一堆数据,数据一共有3020条,包含了10个类别,要求训练一个分类器能够准确识别各个分类。对于小数据规模的机器学习而言,与我们入门时,练手的鸢尾花数据集相比,至少在数据量上还是比较充足的。其实不然,如下表,是整个数据中,各个类别所占的条数:  表1 各类别数据条数 class 1 class 2 cl
相关文章
相关标签/搜索