数据清洗---测试集和训练集分布不一致的状况

在竞赛中,能够会出现提供的数据不符合测试集分布的状况 根据百度车道线冠军的经验: 数据清洗上,最一开始采用了所有数据训练,发现loss常常出现不规则的跳动,通过排查,发现road 3存在几乎一半以上图像过曝的问题,而且road 3大多在强光下拍摄,不符合测试集的分布,因此很果断的舍弃了road 3,分数也提高了0.01左右(好神奇。。。)。 这就说明了,在数据来源不一样的状况下,极可能出现训练集与
相关文章
相关标签/搜索