加强机器学习模型性能——深刻理解随机森林(RandomForest)和 Dropout的原理

要想了解如何加强机器学习模型性能,咱们须要知道如何下降模型的偏差。因此首先咱们必须明白模型偏差是由误差(Bias)和方差(Variance)组成的。误差是指样本预测值的平均值样本真实值的差,而方差是指样本预测值偏离样本预测值平均值的程度
其中
机器学习

  • 误差(Bias)能够描述模型的准确性
  • 而方差(Variance)能够描述模型的稳定性,必定程度上反映了模型泛化能力

因此加强机器学习模型性能就意味着须要提升模型的准确性和稳定性。性能

咱们来看看下图,直观的感觉一下误差(Bias)和方差(Variance)对模型的影响,你能够将其想象一个同窗的一学期的考试状况,越靠红心表明考试得分越高:学习

  • 右下角同窗——学渣,每次考试分数不高,并且成绩还不稳定,属于高误差高方差的模型。
  • 左下角同窗——学庸,成绩很稳定,但是每次考试得分都不高,属于方差较小但是误差较大的模型。
  • 右上角的同窗——学聪,成绩还不错,但是忽高忽低,不稳定,属于误差较小但是方差较大的模型。
  • 左上角的同窗——学霸,成键很棒,并且极其稳定,属于误差较小,方差也小的模型。
相关文章
相关标签/搜索