二分类问题中混淆矩阵、PR以及AP评估指标

仿照上篇博文对于混淆矩阵、ROC和AUC指标的探讨,本文简要讨论机器学习二分类问题中的混淆矩阵、PR以及AP评估指标;实际上,(ROC,AUC)与(PR,AP)指标对具备某种类似性。机器学习

按照按部就班的原则,依次讨论混淆矩阵、PR和AP:

设定一个机器学习问题情境:给定一些肿瘤患者样本,构建一个分类模型来预测肿瘤是良性仍是恶性,显然这是一个二分类问题。
本文中,将良性肿瘤视为正类标签(可能在具体实践中更为关注恶性肿瘤,不过这并不影响技术上的操做)。
当分类模型选定之后,将其在测试数据集上进行评估,分别能够获得如下评估指标:性能

混淆矩阵

TP表示预测为良性,真实状况是良性的样例数;
FN表示预测为恶性,真实状况是良性的样例数;
FP表示预测为良性,真实状况是恶性的样例数;
TN表示预测为恶性,真实状况是恶性的样例数;
以上四类数据构成混淆矩阵。学习

PR

在混淆矩阵的基础上,进一步地定义两个指标。测试

按照下式定义precision(P)指标


precision表示,预测为正的样本中有多少是真正的正样本;精准率强调对某类样本识别的准确性。blog

按照下式定义recall(R)指标


recall表示,样本中的正例有多少被预测正确了;召回率强调对某类样本识别的全面性。ci

precision,recall分别反映分类器对某一类样本鉴别能力的两个方面;一般,这两个指标呈现互斥关系,即一个指标高了每每会导致另外一指标下降。io

由上,一个混淆矩阵对应一对(precision,recall)

须要明确的是,P和R是创建在类别明确的预测结果之上的,即分类模型明确地指出待预测样本的类别。
然而,在二分类问题(0,1)中,通常模型最后的输出是一个几率值,表示结果是1的几率。此时须要肯定一个阈值,若模型的输出几率超过阈值,则归类为1;若模型的输出几率低于阈值,则归类为0。
不一样的阈值会致使分类的结果不一样,也就是混淆矩阵有差,P和TR也就不一样。
当阈值从0开始慢慢移动到1的过程,就会造成不少对(precision,recall)的值,将它们画在坐标系上,就是所谓的PR曲线了。基础

AP

获得PR曲线后,就能够计算曲线下方的面积,计算出来的面积就是AP值。
通常而言,AP越大,模型的性能越好。im

示例

相关文章
相关标签/搜索