机器学习之模型评价指标

时间 2019-11-17

标签机器学习模型评价指标繁體版

原文原文链接

		预测值
		正例	负例
真实值	正例	真正例（A）	假负例（B）
真实值	负例	假正例（C）	真负例（D）

		预测值
		正例	负例
真实值	正例	TP	FN
真实值	负例	FP	TN

模型测试通常用四个指标来衡量：测试

准确率（Accuracy）：提取出的正确样本数/总样本数spa

召回率（Recall）：正确的正例样本数/样本中的正例样本数，也定义为查全率3d

精准率（Precision）：正确的正例样本数/预测为正例的样本数，也定义为查准率blog

F值：等于召回率和精准率的调和平均值ci

这里须要注意的是召回率和精准率的关系是互斥的，其缘由为：io

1.对于召回率而言，其分母是固定的，是真实值中正例的数目，咱们但愿召回率（即查全率）是越高越好的，其极限条件就是当全部值都认定为是正例时，召回率就为1，可是这样作的缺点是没法区分正例和负例，好比，正例为患病人数，负例为健康人数，若是召回率为1，即认为测试样本中的全部人都是有病的，显然这样作是不合理的；table

2.若是咱们但愿召回率增长，即测值中的正例数是增长的，以下表：（其中正例表示患病，负例表示健康，目的是在找出样本中的患病人数）im

状况1call

		预测值
		正例：70	负例：30
真实值	正例：80	TP：60	FN:20
真实值	负例：20	FP：10	TN:10

召回率:3/4（查全率）d3

精准率:6/7（查准率）

状况2

		预测值
		正例：75	负例:25
真实值	正例：80	TP:64	FN:10
真实值	负例:20	FP：11	TN:15

召回率:64/80

精准率:64/75

3.由上面的分析可得，因为真正例和假正例的比例是不变的，当预测值中正例样本数增长时，真正例和假正例的值都会增长，可是分子对于分母差了一个假正例的数值，因此在此状况下，召回率是增长的，即查全率增长，可是差准率相应下降。

简单理解就是，认为多数人是患病的，那么查全的几率是增长的，可是都多数人结果会形成查准的下降。