机器学习中对于分类模型经常使用混淆矩阵来进行效果评价,混淆矩阵中存在多个评价指标,这些评价指标能够从不一样角度来评价分类结果的优劣,如下内容经过简单的理论概述和案例展现来详细解释分类模型中混淆矩阵的评价指标及其用途。机器学习
一、混淆矩阵的概念
二、衍生评价指标
三、ROC曲线、AUC指标
四、R&Python中混淆矩阵函数函数
一、混淆矩阵的基本概念学习
对于分类模型而言(这里仅以最简单的二分类为例,假设只有0和1两类),最终的判别结果无非就四种状况:
实际为0被正确预测为0,实际为0被错误预测为1,实际为1被错误误测为0,实际为1被正确预测为1。blog
以上四类判别结果展现在混淆矩阵上是一个两行两列的交叉矩阵,行分别表明实际的正例和负例,列分别表明预测的正例和负例。it
那么在以上矩阵中:四个象限分别表明四种判别结果:im
左上角被称为真阳性(True Positive,TP):样本实际为正(这里的正负仅仅是相对意义上咱们想要研究的类别)例,且模型预测结果为正例;
右上角被称为假阴性(False Negative,FN):样本实际为正例,但模型预测为负例;
左下角被称为假阳性(False Positive,FP):样本实际类别为负例,但模型预测为正例;
右下角被称为真阴性(True Negative,TN):样本实际类别为负例,且模型预测为负例。d3