机器学习训练集/开发集/测试集挑选

在实际应用领域,通常将数据集分红三块,训练集:用来训练算法;开发集:用来进行特征选择或者调参;测试集:用来检测算法的表现,所以测试集应该可以反映和包含现实的真正数据分布,而不是假设分布。算法 在实际算法迭代过程当中,咱们最后但愿获得的结果是算法在测试集上表现的很是优秀;可是,最近读吴恩达老师的笔记:有时可能咱们须要决定投资多少去获取好的开发集和测试集。切记不要假定你的训练集分布和测试集分布必须是同
相关文章
相关标签/搜索