关于样本均衡的一点点思考

背景: 在分类场景中常常会遇到,某些类别数据特别多,某类或者几类数据特别少。做为极限测试,假如正样本10000个,负样本只有1个。进行模型参数优化。其实至关于一直在优化正样本,使得正样本过学习,负样本几乎没有优化模型参数。针对负样本的1个,很大几率是有问题。为了重述上面的问题。假如如今一个三岁的孩子须要识别哪些是玉米,哪些是小麦。如今有10000个是小麦,只有一个是玉米。那么三岁的孩子会一直处在学
相关文章
相关标签/搜索