深度学习_数据预处理_图像数据均衡与图像数据增广(data augmentation)

首先我们考虑一个二分类问题,比如区分一张图片里的是一只猫还是一只狗。若数据搜集的时候只找到了1000张猫的图片和40000张狗的图片作为训练集。如果直接把这41000张图片放在一起,然后用mini-batch的方法进行训练,就会出现数据不均衡的问题。 比如每次迭代的样本数量为100个,那么平均下来每次样本中猫的数量通常只有1、2个。这样的结果是计算损失函数时,狗的图片比重太大,所以相当于是针对狗的
相关文章
相关标签/搜索