现在在银行,P2P等各类贷款业务机构,广泛使用信用评分,对客户实行打分制,以期对客户有一个优质与否的评判。可是不是全部人都知道信用评分卡还分A,B,C卡三类!因此,若是你只知道ABC是Gary的ABC汤,那就赶忙来补习下这些知识吧~~ html
A卡(Application score card)申请评分卡
B卡(Behavior score card)行为评分卡
C卡(Collection score card)催收评分卡
三种卡的介绍,请直接看这篇文章:比较全面的说了三种打分机制。
梁世栋博士的《行为评分和贷后风险管理研究》http://www.docin.com/p-516772778.html
这三种打分机制的区别在于:
1.使用的时间不一样。分别侧重
贷前、贷中、贷后;
2.数据要求不一样。
A卡通常可作贷款0-1年的信用分析,B卡则是在申请人有了必定行为后,有了较大数据进行的分析,通常为3-5年,C卡则对数据要求更大,需加入催收后客户反应等属性数据。
3.每种评分卡的模型会不同。在A卡中经常使用的有
逻辑回归,
AHP[层次分析法(Analytic Hierarchy Process,简称AHP)]等,而在后面两种卡中,常使用
多因素逻辑回归,精度等方面更好。
3.检测评分卡中客户群的
特征变化,已经这些变化对评分卡分值的冲击。
2.计算
某些特定参数,用以触发某些行动,好比重建评分卡、重设临界值或调整评分卡刻度;
1.判断评分卡的
实际表现,并与开发阶段的
预期对比;
检测与报告:
拒绝演绎:评分卡开发使用的是审批经过且运行一段时间的帐户数据,已经表现出正常或违约的帐户状态。拒绝演绎是尝试去分析可能会违约并在评分卡开发前已经被拒绝的帐户。
9.评分卡的实施:不一样业务部门使用评分卡前,须要将评分卡转换为可实施代码,肯定最终得分的临界值,以对应所需的业务行动。
8.评分卡建立和刻度:logistics回归模型创建并经过检验后,转换为标准评分卡的形式
4.必须
有意义,在业务变量和预测值方面是
可解释的。
3.必须
简单;
2.必须
稳健,能接受更广范围的数据集;
1.必须达到
可接受的准确性水平;
7.模型验证:
6.模型开发:基于
logistics回归模型
5.变量选择:只选择表现出
较强预测力的变量,减小变量的数量
(关于数据准备的内容参考Refaat M.(2006)《Data Preparation for Data Mining Using SAS》
4.评分卡中全部变量都要进行证据
权重(WOE)转换,对变量转换前,须要减小分类变量的基数,须要将连续变量分段。
3.须要进行大量的数据清洗和转换工做;
2.建立包含开发评分卡模型所需的全部要素的惟一数据集;
1.
耗时长,最重要;
4.数据准备:
3.经过列联表、关联性和相关性指标肯定不一样变量之间的检验关系。
2.要素分析:计算每一个候选预测变量分类或分段条件下的违约率分布;
1.候选预测变量的单变量统计特征评价,取值在变量范围内的分布;
3.EDA与数据描述(主要是检查数据并理解其特征):
2.对于外部数据的使用,注意合理选择外部数据供应商。
1.对于内部数据的使用,注意帐户和客户的区别,多个客户会使用一个联名帐户joint accounts;
2.数据获取和整合:
4.设计项目管理计划,对时间、资源、人员进行管理。
3.识别数据的范围和来源,内部仍是外部,确保能获得数据;
2.肯定计划评分卡的范围,开发和实施窗口;
1.在具体业务或信贷历史的认识基础上,肯定违约和正常的定义;
1.问题准备:
评分卡的开发流程:
5.对各个变量的不一样取值范围赋予必定分数,使消费者清楚如何提升信用分。
4.各项变量的简单加法容易在各平台中实现;
3.比率odds ratio的使用;
2.每项加总获得信用分数使信用分数更透明;
1.易于理解;
标准评分卡的优点:
3.若得分在二者之间,则该帐户须要人工干预(要求提供额外信息如工资证实等)。
2.若得分大于Sh,则该帐户为正常;
1.若得分小于Sl,则该帐户为违约;
关于帐户的不肯定值:
状态变量中:1表示违约,0表示正常
正常和违约的标准取决于逾期,通常设置60天、90天或180天的口径。
4.审查贷款订价和贷款条件。
3.制定清收策略(若违约);
2.审查信用额度;
1.审查信用重建;
2.行为评分卡的评分结果更精确,由于基于更多交易数据:
4.贷款订价(利率水平)。
3.贷款额/信用额度;
2.抵押物;
1.估计的信用情况;
1.申请评分卡的评分结果将决定:
评分卡分两类:申请评分卡(批准前)和行为评分卡(批准后):
打分卡技术的核心原理是使用一组变量,经过变量取值获得一个客户信用评分,该评分后面对应的其实是好坏比,好比国际有名的FICO评分680分对应的好坏比是144:1。对银行来讲,掌握了好坏比率,就明确了将来的盈利状况。举例来讲,假定银行当前客户群的好坏比率是20/1,即21我的中20个是好的,一个是坏的。对这我的群发放贷款,必须经过20我的的收入来抵消1个坏客户的支出(假定坏帐户本金所有损失),以最后利润率3%计算,通过计算,能够获得最低放贷利率为8.15%,即对这我的群必须用8.15%的利率才能获得指望的理论收益;一样的方法能够算出,对好坏比率80/1的客户群,其利率是4.2875%。打分会有误差,比如价值和价格出现误差同样。网络
3.打分卡使用
打分卡使用场合不少,包括营销评分、申请评分、行为评分、回款催收评分等等,按照具体的产品还能够分为信用卡、车贷、房贷、经营性贷款评分等等,还有按照不一样地域的评分等等。根据不一样的业务战略,打分卡的各项参数要作设定,打分卡的使用比打分卡开发更重要。
4.打分卡开发
打分卡开发方法,包括逻辑回归、神经网络、决策树、马尔科夫链、生存分析等等,用的最多的,仍是传统的逻辑回归,采用逻辑回归的打分卡开发基本流程大体为选取样本、定义好坏标准、寻找可用变量、选择变量、评分模型开发、设置取舍点(cutoff)六个过程,其主要工做量在前面几部。打分卡模型通常包含15个左右变量,这是因为变量之间通常都会有耦合(耦合是指两个或两个以上的电路元件或电网络等的输入与输出之间存在紧密配合与相互影响,并经过相互做用从一侧向另外一侧传输能量的现象.耦合效应(Coupling Induction),也称互动效应,联动效应),好比职务和职称,职务高的人通常职称也高,但不该该重复计算。若是变量太多,去掉变量间耦合会比较困难,也会使模型不稳定,某个变量的小小变化可能致使分值变化很大。
运用信用评分卡须要注意的问题
一、开展信用卡业务的历史要长。
评分卡的发展必须以历史数据为依据,若是银行刚开始发行信用卡,尚未历史数据,或虽然已经发卡,但历史过短,数据不充分,则不具有开发评分卡的条件。
二、发展信用评分卡须要大量的数据,并且数据的质量要好。(数量+质量)
若是数据不多,不具备表明性或数据质量不好,有不少错误,那么基于该数据的评分卡就不会准确,那么申请评分卡的发展就会受到制约。
三、数据的保存要完整
银行必须把历史上各个时期申请该信用卡的客户申请表信息、当时的信用报告记录、开户的信用卡帐户表现好坏等数据保存起来,不只全部被批准的客户的数据要保存,被拒绝的申请者数据也应该保存,以进行模型的表现推测。并且,保存的数据不只要足以提炼出各类预测变量,还要可以辨别其表现(好、坏等)。
四、申信用评分卡只是提供了决策依据,不是决策自己。
信用评分卡并不能告诉审批人员某个客户必定是好的或坏的,它只是告诉咱们必定的几率,所以,对于有些客户的申请审批决定就必须综合信用报告等其它信息做出判断。
五、一张申请评分卡很难知足整我的群,须要针对不一样人群创建单独的评分卡。(千人千面,分层)
因为我行客户分布在全国各地,存在着较大的地域差异,各地区经济发展也存在着较大差异,客户消费习惯有较大差别,若是使用一张申请评分卡就会形成信用评分的不真实。
六、时间越久,信用评分卡的有效性会下降,由于经济环境、市场情况和申请者、持卡者的构成在不断变化,使得样本人群的特质和属性发生改变,特别是在经济高速发展的阶段,人群的生活方式、消费习惯、经济情况等变化很快,申请评分模型在应用一段时间后一般会与初期模型产生偏移,因此须要适当从新调整,必要时还要从新开发,以保证信用评分卡的有效性。大数据