洛伦兹曲线(Lorenz curve)提高指数、提高表和提高图

洛伦兹曲线(Lorenz curve)也叫提高图或收益曲线python

提高图主要经过随机选择比较模型表现。
洛伦兹曲线(Lorenz curve)提高指数、提高表和提高图
洛伦兹曲线(Lorenz curve)提高指数、提高表和提高图
洛伦兹曲线(Lorenz curve)提高指数、提高表和提高图
绿色曲线比黄色曲线更加不平衡
洛伦兹曲线(Lorenz curve)提高指数、提高表和提高图ide

基尼系数=A/(A+B)学习

A+B为正方形一半恒定面积,A区间面积越大,基尼系数越大
洛伦兹曲线(Lorenz curve)提高指数、提高表和提高图
Lift, Lift Table, and Lift Chart3d

提高指数、提高表和提高图对象

  1. 什么是Lift?

I) Lift(提高指数)是评估一个预测模型是否有效的一个度量;这个比值由运用和不运用这个模型所得来的结果计算而来。blog

II) 一个简单的数字例子:排序

i. 好比说你要向选定的1000人邮寄调查问卷。以往的经验告诉你大概20%的人会把填好的问卷寄回给你,即1000人中有200人会对你的问卷做出回应(response),用统计学的术语,咱们说baseline response rate是20%;ci

ii. 若是你如今就邮寄问卷,1000份你指望能收回200份,这可能达不到一次问卷调查所要求的回收率,好比说工做手册规定邮寄问卷回收率要在25%以上;get

iii. 经过之前的问卷调查,你收集了关于问卷采访对象的相关资料,好比说年龄、教育程度之类。利用这些数据,你肯定了哪类被访问者对问卷反应积极。假设你已经利用这些过去的数据创建了模型,这个模型把这1000人分了类,如今你能够从你的千人名单中挑选出反应最积极的100人来,这10%的人的反应率(response rate)为60%。那么,对这100人的群体(咱们称之为Top 10%),经过运用咱们的模型,相对的提高(gain or lift value)就为60%/20%=3;换句话说,与不运用模型而随机选择相比,运用模型而挑选有3倍的好处;数据分析

iv. 相似地,对占总样本的任何比例的人群,咱们均可以计算出相应的提高指数,好比说咱们能够计算Top 20%的群体的提高指数。

III) 一个结论就是,提高指数越大,模型的运行效果越好。

  1. 创建Lift Table 的步骤(并画出Lift Chart),以验证信用评分模型为例:

I) 利用已经创建的评分模型,对咱们要验证的样本进行评分。样本下的每个个体都将获得一个分数,或者是违约几率,或者是一个分值;

II) 对样本按照上面计算好的分数进行降序排序;

III) 把已经排好序的样本依次分红10个数量相同的群体,咱们就创建了一个叫decile的变量,它依次取10个值,一、二、三、四、五、六、七、八、九、10,diclie1包括违约几率值较高的10%的个体,diclie2包括下一个10%的群体,以此类推;

IV) 账户总数是每一个decile下的样本数,它是整个样本数的10%;

V) 边际坏帐数是每一个decile内违约的人数,就是说,利用咱们的评分模型,在decile1,有25我的违约,以此类推;

VI) 累计坏帐数,45代表前两个decile内共有45我的违约,以此类推;

VII) 边际坏帐率是每一个decile内坏帐的比率。对decile1,边际坏帐率由25/100得来;

VIII) 对每个加总的decile,都计算一个累计坏帐率,好比说,对前两个decile,也就是整个样本的20%,累计坏帐率等于(25+20)/(100+100);

IX) 在每一个decile里,提高指数(Lift)就是相应的累计坏帐率与平均坏帐率的偏离程度,计算公式是(累计坏帐率-平均坏帐率)/平均坏帐率,习惯上还会乘上一个100。

X) 注:在一些处理中,提高指数直接由每一个decile的累计坏帐率除以平均坏帐率得来,它们之间就相差1,一个是相对偏离,一个是偏离。

XI) 就咱们考察的信用评分模型,它的目的就是尽量把人群区别来开来,好比说“好”的顾客、 “坏”的顾客。提高指数越大,代表模型运做效果越好。

表1:Lift Table
洛伦兹曲线(Lorenz curve)提高指数、提高表和提高图

欢迎各位同窗学习python金融风控评分卡模型和数据分析微专业课
https://edu.51cto.com/sd/f2e9b
洛伦兹曲线(Lorenz curve)提高指数、提高表和提高图

相关文章
相关标签/搜索