【机器学习】准确率、精确率、召回率

纠正下,精确率(precision)和准确率(accuracy)是不同的,题主问的应该是精确率与召回率之间的差异。 Blog
一.定义辨析算法

- TP,True Positive

- FP,False Positive

- TN,True Negative

- FN,False Negative
并发

精确率:precision = TP / (TP + FP)   分母是预测为正的样本数性能

召回率:recall = TP / (TP + FN)  原来样本中全部的正样本数spa

准确率:accuracy = (TP + TN) / (TP+ FP + TN + FN)htm

精确率是针对咱们预测结果而言的,它表示的是预测为正的样本中有多少是真正的正样本。ci

召回率是针对咱们原来的样本而言的,它表示的是样本中的正例有多少被预测正确了。get

实际上很是简单,精确率是针对咱们预测结果而言的,它表示的是预测为正的样本中有多少是真正的正样本。那么预测为正就有两种可能了,一种就是把正类预测为正类(TP),另外一种就是把负类预测为正类(FP),也就是it


召回率是针对咱们原来的样本而言的,它表示的是样本中的正例有多少被预测正确了。那也有两种可能,一种是把原来的正类预测成正类(TP),另外一种就是把原来的正类预测为负类(FN)。io

其实就是分母不一样,一个分母是预测为正的样本数,另外一个是原来样本中全部的正样本数class

举个栗子

假设咱们手上有60个正样本,40个负样本,咱们要找出全部的正样本,系统查找出50个,其中只有40个是真正的正样本,计算上述各指标。
  • TP: 将正类预测为正类数 40
  • FN: 将正类预测为负类数 20
  • FP: 将负类预测为正类数 10
  • TN: 将负类预测为负类数 30

准确率(accuracy) = 预测对的/全部 = (TP+TN)/(TP+FN+FP+TN) = 70%
精确率(precision) = TP/(TP+FP) = 80%
召回率(recall) = TP/(TP+FN) = 2/3

而F值,则是综合这两者指标的评估指标,用于综合反映总体的指标。
F值  = 正确率 * 召回率 * 2 / (正确率 + 召回率) (F 值即为正确率和召回率的调和平均值)。

调和平均值公式:

ROC 曲线在 Y 轴上画出了真正例率(TPR),在 X 轴上画出了假正例率 (FPR)(在全部真假中有多少被标记位假真了)。TPR 是召回率,FPR 是反例被报告为正例的几率。这二者均可以经过混淆矩阵计算获得。

1.  选择最佳的诊断界限值。ROC曲线越靠近左上角,试验的准确性就越高。最靠近左上角的ROC曲线的点是错误最少的最好阈值,其假阳性和假阴性的总数最少

2.  两种或两种以上不一样诊断试验对算法性能的比较。在对同一种算法的两种或两种以上诊断方法进行比较时,可将各试验的ROC曲线绘制到同一坐标中,以直观地鉴别优劣,靠近左上角的ROC曲线所表明的受试者工做最准确。亦可经过分别计算各个试验的ROC曲线下的面积(AUC)进行比较,哪种试验的 AUC最大,则哪种试验的诊断价值最佳。

  在阈值为 1.0 的状况下,咱们将位于图的左下方,由于没有将任何数据点识别为正例,这致使没有真正例,也没有假正例(TPR = FPR = 0)。当下降阈值时,咱们将更多的数据点识别为正例,致使更多的真正例,但也有更多的假正例 ( TPR 和 FPR 增长)。最终,在阈值 0.0 处,咱们将全部数据点识别为正,并发现位于 ROC 曲线的右上角 ( TPR = FPR = 1.0 )。

相关文章
相关标签/搜索