kappa系数

python机器学习-乳腺癌细胞挖掘(博主亲自录制视频)https://study.163.com/course/introduction.htm?courseId=1005269003&utm_campaign=commission&utm_source=cp-400000000398149&utm_medium=share

python脚本python

"""
项目合做QQ:231469242
这个系数的取值范围是[-1,1],实际应用中,通常是[0,1]
这个系数的值越高,则表明模型实现的分类准确度越高
"""

def kappa(matrix):
    n = np.sum(matrix)
    sum_po = 0
    sum_pe = 0
    for i in range(len(matrix[0])):
        sum_po += matrix[i][i]
        row = np.sum(matrix[i, :])
        col = np.sum(matrix[:, i])
        sum_pe += row * col
    po = sum_po / n
    pe = sum_pe / (n * n)
    # print(po, pe)
    return (po - pe) / (1 - pe)
#其中,matrix是一个方阵,若共有i个类别,则matrix.shape = (i,i). 
#用下面的代码进行测试:

import numpy as np
matrix = [
    [239,21,16],
    [16,73,4],
    [6,9,280]]

matrix = np.array(matrix)
print(kappa(matrix))

  

参考连接: http://www.javashuo.com/article/p-mnlxmrzj-du.html

引言

分类是机器学习中监督学习的一种重要应用,基于统计的机器学习方法能够使用SVM进行二分类,能够使用决策书,梯度提高树等进行多分类。 
对于二分类模型,咱们一般能够使用ROC曲线来评估模型的预测效果。这里,咱们介绍一下在多分类中衡量模型评估准确度的一种方法–kappa系数评估方法。
app

Kappa系数

首先,咱们介绍一下kappa系数: 
kappa系数是用在统计学中评估一致性的一种方法,咱们能够用他来进行多分类模型准确度的评估,这个系数的取值范围是[-1,1],实际应用中,通常是[0,1],与ROC曲线中通常不会出现下凸形曲线的原理相似。 
这个系数的值越高,则表明模型实现的分类准确度越高。kappa系数的计算方法能够这样来表示:
机器学习

 

 

 

 

python信用评分卡建模(附代码,博主录制)

相关文章
相关标签/搜索