消费金融大数据风控架构与实践（云时代架构文章读后感07）

时间 2019-11-18

原文原文链接

风险：mysql

1.1 信用风险算法

根据银行业的风险理论，信用风险是指借款人因各类缘由未能及时、足额偿还债权人或银行贷款而违约的可能性。sql

信用风险的风控重点在于，甄别客户违约的缘由到底是还款能力，仍是还款意愿问题。若是客户真的因为各方面的缘由，暂时不具有还款能力，这是几率问题。即便发生了，处置起来也不会有什么损失。而若是是还款意愿问题，存在较大的资金损失几率。数据库

1.2 欺诈风险缓存

在风控中，欺诈风险比信用风险要大得多，因此反欺诈是重中之重。通常来讲正常的客户，若是不是刻意骗贷的，只是由于家里出现突发事故、生意出现问题、暂时失业等等缘由而致使资金周转不过来而逾期的，这毕竟是少数，并且借款只是逾期，可以还款的几率仍是比较高。网络

消费金融行业绝大多数不良是由于欺诈引发的，若是反欺诈可以比较有效的状况下，信用风险控制在5%之内没有太大问题。架构

挑战：并发

消费金融发放的借款都就小额分散的，没有任何抵押和担保的状况。随着消费金融行业的崛起和规模扩大，整个行业面临的欺诈问题愈来愈严重，一批批的羊毛党和欺诈等黑产团体接踵而来。黑产团队的规模越大，意味着消费金融机构的损失越大。框架

欺诈风险目前是总体消费金融风控的重点，目前整个行业75%甚至以上的风险都是来自欺诈风险。形式有不少种，如常见的身份伪冒、中介黑产、伪造材料、恶意套现等。欺诈主体一是申请本人或亲戚朋友，二是借用或盗用别人的身份信息进行欺诈。欺诈主体的不一样，防范风险的手段和形式也不一样。异步

架构实践：

4.1 业务架构

风控平台是相对独立的系统，信审的案件能够从借款端平台推过来，也能够从第三方平台推过来。信审案件到达风控平台后，自动建立工做流，根据风控流程处理各流程环节任务。

• 自动决策

风控流程自动处理案件，访问第三方合做伙伴的接口，获取用户黑名单、欺诈数据和多头借贷等数据，查询名单数据，决策引擎输出各环节处理结果。自动决策后出三个结果，自动经过、转人工、拒绝。

• 人工信审

根据决策引擎输出的结果进行转人工处理，人工经过初审和复核岗，给出具体信审结果，信审经过的案件给出风险等级和具体额度。

• 拒绝

被自动或者人工拒绝的案件通知到用户，建议补充资料、过段时间从新申请或者推荐到第三方机构。

4.2 技术架构

4.2.1 分布式、微服务架构

分布式架构目前是互联网行业成熟应用的架构，这里不详细讨论。

微服务架构下，比较成熟的使用Spring Framework，使用MyBatis、Hibernate等数据映射框架。

4.2.2 RPC架构

RPC是分布式架构的核心，解决服务分布和服务解耦问题，目前咱们使用的是Dubbo, RPC框架解决序列化、反序列化、网络框架、链接池、收发线程、超时处理、状态机等“业务以外”的重复技术劳动。

4.2.3 分布式消息

分布式系统中重要的组件，解决应用耦合，异步消息，流量削锋等问题，是分布式系统不可缺乏的中间件。目前在生产环境，使用较多的消息队列有ActiveMQ，RabbitMQ，ZeroMQ，Kafka，MetaMQ，RocketMQ等。

4.2.4 分布式缓存

高并发环境下，大量的读写请求涌向数据库，磁盘的处理速度与内存显然不在一个量级，从减轻数据库的压力和提升系统响应速度两个角度来考虑，通常都会在数据库以前加一层缓存。因为单台机器的内存资源以及承载能力有限，而且，若是大量使用本地缓存，也会使相同的数据被不一样的节点存储多份，对内存资源形成较大的浪费，所以，才催生出了分布式缓存。经常使用的分布式缓存是Redis。

4.2.5 分布式日志

分布式状况下，每一个日志分散到各自服务所在机器，日志的收集和分析须要统一处理。日志框架主要这几块内容：

• 业务日志埋点

• 日志收集处理系统

• 日志处理系统

• 日志分析系统

ELK（ElasticSearch, Logstash, Kibana）平台能够实现日志收集、日志搜索和日志分析的功能。

4.3 反欺诈平台

目前的欺诈团伙已经造成完整的地下产业链，反欺诈平台须要根据平台沉淀的用户数据、环境数据、第三方数据结合生物探针技术采集的本次用户行为数据，创建用户、环境、行为画像以及基于用户、环境、行为的关系网络，经过对业务数据创建多重模型来甄别对异经常使用户的识别能力和反欺诈能力。

4.3.1 数据来源

数据源主要是三个方向：

1. 用户申请过程的填写的数据和埋点时采集的行为数据和日志数据。

2. 第三方合做数据，如人行征信数据、学历、多头借贷等数据。

3. 互联网上的数据，须要靠开发的爬虫平台去抓取。

数据分类主要如下几类：

1. 身份信息：姓名、身份证、手机号、卡号、居住地址、学历等。

2. 信用信息：收入信息、借款信息、账户信息、还款和逾期信息。

3. 社交信息：通迅录信息、通话记录、QQ和其它平台交互信息。

4. 消费信息：银行卡详单、电商网站购买信息等其它信息。

5. 行为信息：申请和填写信息、GPS、时间点、地点等信息。

6. 第三方：多头信息、黑灰名单、授信信息。

4.3.2 反欺诈模型

以上的多方面数据，能够根据对用户行为、语义、关联网络等组成一个巨大的数据关系图谱。利用这些数据创建的模型风控体系对用户的欺诈几率、还款风险等进行强有力的预测和判断。

4.3.2.1 社交图谱模型

利用“手机-设备”及“手机-手机（通话）”关系，进行图建模，全部用户及外部已知风险手机号容纳在一张图中，经过图中的风险标记以及图中的异常关系结构。

用户数据量上来的时候，社交关系很容易破亿，这时候就要使用图数据库，相对成熟就是Neo4j，比易用性和稳定性来说Neo4j比orientdb和arangodb要好不少。

NEO4J数据库，其可提供35亿节点，当前2.5亿多点，其中付费版支持无限节点，费用是6.8万美圆/年。

4.3.2.2 黑产攻击模型

经过分析收集的高风险人群及中介通话数据，挖掘出一张高风险人群联系密切的关系网，有效识别申请动机不良的客户，发现黑产攻击苗头。

4.3.2.3 多头授信模型

经过对客户与各种机构的通讯关系，发现一些体现多头风险异常结构，如客户总被一些催收机构联系，同时又在主动拨打其余一些机构的营销电话。

4.3.2.4 频次异常分析

欺诈团伙在发现系统规则漏洞时，每每会在短期内发起大量欺诈交易，以便在受害者反应过来前尽快变现，例如医美欺诈案，短期内大量发起虚假的美容贷款请求。

这种交易的频次经常会在时间分布上造成异常的波形，经过ARIMA模型能够很好的预测事件的时间分部特征，贝叶斯框架的生成式模型可以解决不一样空间分布维度下细颗粒都的时间分布问题。

经过这两种手段能够将时间和空间分布上存在异常的交易行为与正常的交易行为区分开来。

4.3.2.5 欺诈团伙发现

在互联网金融行业，欺诈团伙日益严重而且难以防范。从特色上来看，团伙欺诈有以下几个特色：

• 专业性。欺诈团伙一般会根据各平台的风控规则，制定相应的欺诈手段；

• 多变性。欺诈团伙的欺诈手法常常变化，让各平台防不胜防；

• 爆发性。欺诈团伙一旦发现欺诈的可能性，会在短期内，利用地下渠道得到的身份信息，大量反复地欺诈；

团伙欺诈的发现是业务反欺诈领域面临的一个重要挑战。目前反团伙欺诈技术思路以下：

• 构成网络：将交易，交易信息项（地址，电话，设备id），用户等定义为节点；同属一个交易的节点间造成边；对边根据业务经验或其余规则赋予权重；

• 特征提取和信息挖掘：提取网络饱和度，网络直径，关联度，中心度，群聚系数等特征；基于已有的黑名单，利用社区发现等算法获得节点的欺诈相关程度预测；

• 加入模型：提取的特征能够做为模型或规则的输入；

• 欺诈预警：在无标注数据的状况下，及时发现异常的网络拓扑结构，做为欺诈的早期预警；

4.3.2.6 评分模型

在消费金融反欺诈领域，各类欺诈特征常以规则形式出现，经过一系列的规则的逻辑组合，排除有欺诈嫌疑的进件:

• 规则系统优势：可解释性强，能够迅速调整，应对欺诈手段变化；

• 规则系统缺点：复杂的规则体系难于维护，难以利用弱特征，对强特征依赖，容易被攻破；

评分模型：评分模型在金融领域应用至关成熟，信用评分模型是最多见的应用。但公司将评分模型应用到反欺诈场景时经常与信用评分混淆，但本质上，两者的预测目标是不一样的，反欺诈模型预测的是欺诈的可能性，信用模型预测的是还款的可能性。所以创建独立的反欺诈评分模型颇有必要。

反欺诈评分模型有以下优势：

• 能够充分利用弱特征；

• 对抗性好，模型结构由一系列弱特征决定，提升欺诈者假装成本；

反欺诈评分模型和反欺诈规则系统有很好的互补性，在风控平台中，同时创建起反欺诈规则系统和评分模型颇有必要。

4.4 变量平台

反欺诈模型和信用模型两个模型体系里，最基础的须要先加工出风控变量，根据基础信息、关联关系、信用历史、设备信息、社交数据以及消费和交易数据等六大纬度加工出数百、数千或者数万个变量。输出给模型进行计算和决策。

基于实时决策的风控流程须要对数据和大部分变量加工有实时性要求。随着数据量愈来愈大，传统关系数据没法解决实时和效率的问题，基于Hadoop平台的解决方案成为变量平台的方案。

4.4.1 数据来源

• 实时日志采集：

业务埋点在流程处理中把风控须要的数据打印到日志中。

Flume从日志采集的数据放入kafka消息队列中。

• 实时日志采集：

经过Canal分析mysql的bilog日志，放到kafka中。

4.4.2 数据加工

Spark streaming处理时效只能达到准实时，因此变量加工采用Storm方案。Storm能够达到低延迟的响应，在秒级或者毫秒级完成分析、并获得响应，并且体系可以随着数据量的增大而拓展。