预测值 | |||
正例 | 负例 | ||
真实值 | 正例 | 真正例(A) | 假负例(B) |
负例 | 假正例(C) | 真负例(D) |
预测值 | |||
正例 | 负例 | ||
真实值 | 正例 | TP | FN |
负例 | FP | TN |
模型测试通常用四个指标来衡量:测试
准确率(Accuracy): 提取出的正确样本数/总样本数spa
召回率(Recall):正确的正例样本数/样本中的正例样本数,也定义为查全率3d
精准率(Precision):正确的正例样本数/预测为正例的样本数,也定义为查准率blog
F值:等于召回率和精准率的调和平均值ci
这里须要注意的是召回率和精准率的关系是互斥的,其缘由为:io
1.对于召回率而言,其分母是固定的,是真实值中正例的数目,咱们但愿召回率(即查全率)是越高越好的,其极限条件就是当全部值都认定为是正例时,召回率就为1,可是这样作的缺点是没法区分正例和负例,好比,正例为患病人数,负例为健康人数,若是召回率为1,即认为测试样本中的全部人都是有病的,显然这样作是不合理的;table
2.若是咱们但愿召回率增长,即测值中的正例数是增长的,以下表:(其中正例表示患病,负例表示健康,目的是在找出样本中的患病人数)im
状况1call
预测值 | |||
正例:70 | 负例:30 | ||
真实值 | 正例:80 | TP:60 | FN:20 |
负例:20 | FP:10 | TN:10 |
召回率:3/4(查全率)d3
精准率:6/7(查准率)
状况2
预测值 | |||
正例:75 | 负例:25 | ||
真实值 | 正例:80 | TP:64 | FN:10 |
负例:20 | FP:11 | TN:15 |
召回率:64/80
精准率:64/75
3.由上面的分析可得,因为真正例和假正例的比例是不变的,当预测值中正例样本数增长时,真正例和假正例的值都会增长,可是分子对于分母差了一个假正例的数值,因此在此状况下,召回率是增长的,即查全率增长,可是差准率相应下降。
简单理解就是,认为多数人是患病的,那么查全的几率是增长的,可是都多数人结果会形成查准的下降。