前期作数据可视化,发现标签数据存在一些孤立点(噪声点),影响kmeans聚类。网络
处理方法以下:工具
使用kmeans迭代10次获得聚类中心opencv
计算全部数据到其聚类中心的欧式距离均值和方差数据可视化
经过拟合正态分布,把到聚类中心距离大于均值+1.96*方差的点剔除训练集(根据正态分布0.95面积算的)可视化
获得新的训练集以及anchor方法
以上方法并不彻底适应yolo计算anchor的需求(与yolo网络自己有关)数据
建议使用darknet自带的anchor计算工具,而非opencv的kmeans工具。标签