信用评分卡(A卡/B卡/C卡)的模型简介及开发流程|干货

https://blog.csdn.net/varyall/article/details/81173326算法

现在在银行、消费金融公司等各类贷款业务机构,广泛使用信用评分,对客户实行打分制,以期对客户有一个优质与否的评判。可是不是全部人都知道信用评分卡还分A,B,C卡三类!数据库

A卡(Application score card)申请评分卡大数据

B卡(Behavior score card)行为评分卡.net

C卡(Collection score card)催收评分卡设计

评分机制的区别在于:blog

1.使用的时间不一样。分别侧重贷前、贷中、贷后;开发

2.数据要求不一样。A卡通常可作贷款0-1年的信用分析,B卡则是在申请人有了必定行为后,有了较大数据进行的分析,通常为3-5年,C卡则对数据要求更大,需加入催收后客户反应等属性数据。get

3.每种评分卡的模型会不同。在A卡中经常使用的有逻辑回归,AHP等,而在后面两种卡中,常使用多因素逻辑回归,精度等方面更好。数据分析

信用评分是指根据银行客户的各类历史信用资料,利用必定的信用评分模型,获得不一样等级的信用分数,根据客户的信用分数,授信者能够经过分析客户按时还款的可能性,据此决定是否给予授信以及授信的额度和利率。产品

虽然授信者经过人工分析客户的历史信用资料,一样能够获得这样的分析结果,但利用信用评分却更加快速、更加客观、更具备一致性。

1、引进信用评分卡的目的及意义

一、因为零售信贷业务具备笔数多、单笔金额小、数据丰富的特征,决定了须要对其进行智能化、几率化的管理模式。信用评分模型运用现代的数理统计模型技术,经过对借款人信用历史记录和业务活动记录的深度数据挖掘、分析和提炼,发现蕴藏在纷繁复杂数据中、反映消费者风险特征和预期信贷表现的知识和规律,并经过评分的方式总结出来,做为管理决策的科学依据。

二、目前国内大多数银行信用卡部门采起人工审批做业形式,审批依据是审批政策、客户提供的资料及审批人员的我的经验进行审批判断,存在如下问题:

(1)信审人员对申请人所提交申请资料真实性的认定基本依赖于受理申请资料的信贷业务员的职业操守和业务素质,审批人员对申请人资料的核实手段基本依赖于电话核查,对申请核准与否基本依赖于本身的信审业务经验,授信审查成本高、效率低而又面临很大的欺诈风险,这种情况很难应对年底所谓的“行业旺季”中大规模集中的小额贷款业务须要。

(2)审批决策容易受主观因素影响、审批结果不一致,审批政策调控能力相对薄弱。

(3)不利于量化风险级别,没法进行风险分级管理,影响风险控制的能力及灵活度,难以在风险与市场之间寻求合适的平衡点。

(4)审批效率还有较大提高空间。

三、信用评分卡具备客观性,它是根据从大量数据中提炼出来的预测信息和行为模式制定的,反映了借款人信用表现的广泛性规律,在实施过程当中不会因审批人员的主观感觉、我的偏见、我的好恶和情绪等改变,减小了审批员过去单凭人工经验进行审批的随意性和不合理性。

四、信用评分卡具备一致性,在实施过程当中先后一致,不管是哪一个审批员,只要用同一个评分卡,其评估和决策的标准都是同样的。

五、信用评分卡具备准确性,它是依据大数原理、运用统计技术科学地发展出来的,预测了客户各方面表现的几率,使银行能比较准确地衡量风险、收益等各方面的交换关系,找出适合本身的风险和收益的最佳平衡点。

六、运用信用评分卡能够极大地提升审批效率。因为信用评分卡是在申请处理系统中自动实施,只要输入相关信息,就能够在几秒中内自动评估新客户的信用风险程度,给出推荐意见,帮助审批部门更好地管理申请表的批核工做,对于业务批量巨大、单笔业务金额较小的产品特别适合。

2、信用评分模型的简介

信用评分模型的类型较多,比较常使用的3个以下:

(1)在客户获取期,创建信用局风险评分,预测客户带来违约风险的几率大小;

(2)在客户申请处理期,创建申请风险评分模型,预测客户开户后必定时期内违约拖欠的风险几率,有效排除了信用不良客户和非目标客户的申请;

(3)在账户管理期,创建催收评分模型,对逾期账户预测催收策略反应的几率,从而采起相应的催收措施。

3、信用评分卡的开发

信用评分模型开发流程包括模型的设计与规划、样本的选择、预测变量的选择和肯定、模型的制定、模型效果的评估和检验、模型的实施、模型表现的跟踪和监控等。

(1)创建开发目标、方法及业务问题的定义

开发目标:

一、确保决策的一致性,减小人工干预,提升信贷政策的执行力;

二、准确反映并量化客户的风险级别,用科学的方法管理风险以控制和减小信贷损失;

三、提升市场竞争能力,在控制可接受的风险水平的同时争取更多优质客户,有效地提升市场占有率;

四、实现审批流程自动化,减小运营成本。

模型创建方法:创建模型可采用的方法不少,业内一般使用逻辑回归方法创建贷款申请评分模型。

好、坏客户定义:好、坏客户的定义必须与银行整体政策、管理目标一致,综合考虑风控策略、催收策略、业务历史、样本数量的须要,如定义曾经有90天以上逾期不良记录的客户为坏客户;定义满12个月,未出现90天以上逾期记录的客户为好客户。

(2)肯定数据源,选取样本

数据来源:内部信用卡核心系统数据库和其它相关业务系统;

样本总数量:选取某地区从2014年1月开始2016年6月的全部申请人,总数120,000人(包括好、坏客户及拒绝的申请客户);

样本空间:

一、坏客户样本空间:2014年8月至2016年2月之间开户的客户;

二、好客户样本空间:2014年6月至2015年5月之间开户的客户;

三、被拒绝客户样本空间:2015年7月至2016年6月之间申请被拒绝的客户。

(3)数据抽取、清理和整理,创建数据集

这一步是开发申请评分模型中最重要、最耗时的步骤之一。数据质量好坏是决定开发的模型成功的关键因素。在肯定数据来源后,因为须要采集的数据资料来源不一,数据量大,抽取时耗时较多,就须要在原始数据的基础上,根据业务需求、数据性质、结构及内在逻辑,对数据进行归类、合并、分组,最终创建数据集(或数据仓库)。

(4)数据分析、变量选择及转换

数据通过整理后下一步进行数据资料的分析,找出其内在关联性,并通过对样本变量的分组、合并和转换,选择符合建模条件、具备较强预测能力的变量。

若是是连续变量,就是要寻找合适的切割点把变量分为几个区间段以使其具备最强的预测能力。例如客户年龄就是连续变量,在这一步就是要研究分红几组、每组切割点在哪里预测能力是最强的。这一步是评分模型很是重要也是最耗费时间的步骤。若是是离散变量,每一个变量值都有必定的预测能力,可是考虑到可能几个变量值有相近的预测能力,所以分组就是不可避免并且十分必要的。

经过对变量的分割、分组和合并转换,最终剔除掉预测能力较弱的变量,筛选出符合小额贷款实际业务需求、具备较强预测能力的变量,使创建的模型更加有效。

(5)建立评分模型

利用上面分组后造成的最新数据集进行逻辑回归运算获得初始回归模型。在回归模型的基础上,经过几率与分数之间的转换算法把几率转换成分数进而获得初始评分卡。下一步要将初始评分卡通过拒绝推论,所谓拒绝推论,即申请被拒绝的客户数据未归入评分系统,致使样本选取的非随机性,总体信用状况所以被扭曲,信用评分模型的有效性下降。

由于申请风险评分模型是用来评估将来全部借款申请人的信用,其样本必须表明全部的借款申请群体,而不只表明信用质量较好、被批准的那部分客户的信用情况,因此样本必须包括历史上申请被拒绝的申请人,不然,样本空间自己就会出现系统性误差。由于样本排除了较高信用风险的申请人群体(即历史上申请被拒绝的客户)。若是仅仅依靠被批准申请人群体的样本开发评分模型,并将其运用到整个申请人群体中去,而被批准和被拒绝群体的行为特征和“坏”的比例每每截然不同,那么这种以被批准群体表明被拒绝群体的作法将必然在很大程度上弱化模型的预测精度。

进行拒绝推论时,因为这部分被拒绝申请人的好坏表现是不可知的,必须以必定的统计手段来推测。推测的方法有不少,能够利用初始评分卡对这部分被拒绝客户进行评分,从而得出每一个被拒绝客户若是被审批成为好客户的几率和坏客户的几率,再按其权重放入模型样本中,这样会尽可能减小样本的误差,同时兼顾拒绝样本的不肯定性。咱们利用拒绝推论后造成的样本(包括核准和拒绝的)从新对每一个变量进行分组,其原理和方法与初始分组相同。而后对第二次分组造成的数据集创建逻辑回归模型。最后在第二次回归模型的基础上,经过几率与分数之间的转换算法把几率转换成分数,进而获得最终评分卡。

(6)模型检验

模型创建后,须要对模型的预测能力、稳定性进行检验后才能运用到实际业务中去。申请评分模型的检验方法和标准一般有:交换曲线、K-S指标、Gini数、AR值等。通常来讲,若是模型的K-S值达到30%,则该模型是有效的,超过30%以上则模型区分度越高,本例中模型的K-S值达到40%以上,已经能够上线使用。

(7)创建MIS报表,模型的实施、监控及调整

模型实施后,要创建多种报表对模型的有效性、稳定性进行监测,如:稳定性监控报表,比较新申请客户与开发样本客户的分值分布,监控模型有效性;特征分析报表,比较当前和开发期间的每一个记分卡特征的分布,监控模型有效性;不良贷款分析报表,评估不一样分数段的不良贷款,而且与开发时的预测进行比较,监控客户信贷质量;最后分值分析报表,分析不一样分数段的申请人、批准/拒绝以及分数调整的客户分布,监控政策执行状况等。

另外,随着时间的推移,申请评分卡的预测力会减弱,由于经济环境、市场情况和申请者、持卡者的构成在不断变化,同时,银行总体策略和信贷政策的变化也要求评分模型适时调整,因此,申请评分卡在创建后须要持续监控,在应用一段时间(通常2-3年)之后必须适当从新调整或重建。

4、运用信用评分卡须要注意的问题

一、开展贷款业务的历史要长。

评分卡的发展必须以历史数据为依据,若是公司开展小贷业务的历史过短,数据不充分,则不具有开发评分卡的条件。

二、发展信用评分卡须要大量的数据,并且数据的质量要好。

若是数据不多,不具备表明性或数据质量不好,有不少错误,那么基于该数据的评分卡就不会准确,那么申请评分卡的发展就会受到制约。

三、数据的保存要完整

小贷公司必须把历史上各个时期申请贷款的客户申请表信息、当时的信用报告记录等数据保存起来,不只全部被批准的客户的数据要保存,被拒绝的申请者数据也应该保存,以进行模型的表现推测。并且,保存的数据不只要足以提炼出各类预测变量,还要可以辨别其表现(好、坏等)。

四、信用评分卡只是提供了决策依据,不是决策自己。

信用评分卡并不能告诉审批人员某个客户必定是好的或坏的,它只是告诉咱们必定的几率,所以,对于有些客户的申请审批决定就必须综合信用报告等其它信息做出判断。

五、一张申请评分卡很难知足整我的群,须要针对不一样人群创建单独的评分卡。

因为爱投在外地其余省份还有好几家分公司,存在着较大的地域差异,各地区经济发展也存在着较大差异,客户消费习惯有较大差别,若是使用一张申请评分卡就会形成信用评分的不真实。

六、时间越久,信用评分卡的有效性会下降,由于经济环境、市场情况和申请者、借款人的构成、业务的来源渠道在不断变化,使得样本人群的特质和属性发生改变,特别是在经济高速发展的阶段(或是股市大牛市阶段),人群的生活方式、消费习惯、经济情况等变化很快,申请评分模型在应用一段时间后一般会与初期模型产生偏移,因此须要适当从新调整,必要时还要从新开发,以保证信用评分卡的有效性。

 

 

https://www.sohu.com/a/164097017_305272

相关文章
相关标签/搜索