Flink实时风控

典型的风控场景包括:注册风控、登录风控、交易风控、活动风控等,而风控的最佳效果是防患于未然,因此事前事中和过后三种实现方案中,又以事前预警和事中控制最好。git

系统架构

  • 业务系统
  • 风控系统,为业务系统提供支持,根据业务系统传来的数据或埋点信息来判断当前用户或事件有无风险;
  • 惩罚系统,业务系统根据风控系统的结果来调用,对有风险的用户或事件进行控制或惩罚,好比增长验证码、限制登录、禁止下单等等;
  • 分析系统,该系统用以支持风控系统,根据数据来衡量风控系统的表现,好比某策略拦截率忽然下降,那可能意味着该策略已经失效,又好比活动商品被抢完的时间忽然变短,这代表整体活动策略可能有问题等等,该系统也应支持运营/分析人员发现新策略;

风控系统方案
该系统有三条数据流向:github

  • 实时风控数据流,由红线标识,同步调用,为风控调用的核心链路;
  • 准实时指标数据流,由蓝线标识,异步写入,为实时风控部分准备指标数据;
  • 准实时/离线分析数据流,由绿线标识,异步写入,为风控系统的表现分析提供数据;

风控系统

风控系统实际是包含两部份内容,一是识别风险,二是对识别后的风险或是自动的或是人工的进行处理,而后后台管理系统根据处理的结果作出相应的惩罚管理,如:验证码增强、帐号封禁、短信通知架构

风控系统有规则和模型两种技术路线,规则的优势是简单直观、可解释性强、灵活,因此长期活跃在风控系统之中,但缺点是容易被攻破,一但被黑产猜中就会失效,因而在实际的风控系统中,每每须要再结合上基于模型的风控环节来增长健壮性异步

规则就是针对事物的条件判断,规则能够组合成规则组,咱们针对注册、登录、交易、活动分别假设几条规则,好比:jvm

  • 用户名与身份证姓名不一致;
  • 某 IP 最近 1 小时注册帐号数超过 10 个;
  • 某帐号最近 3 分钟登录次数大于 5 次;
  • 某帐号群体最近 1 小时购买优惠商品超过 100 件;
  • 某帐号最近 3 分钟领券超过 3 张;

规则可由运营专家凭经验填写,也可由数据分析师根据历史数据发掘,但由于规则在与黑产的攻防之中会被猜中致使失效,因此无一例外都须要动态调整。其实包括三个部分:事件

  • 事实,即被判断的主体和属性,如上面规则的帐号及登录次数、IP 和注册次数等;
  • 条件,判断的逻辑,如某事实的某属性大于某个指标;
  • 指标阈值,判断的依据,好比登录次数的临界阈值,注册帐号数的临界阈值等;

规则分类:get

  • 静态规则,基于某个静态值的限制性规则,好比三元验证一致、是否命中黑名单、经常使用联系人验证、电信服务使用地理范围验证等同步

  • 统计规则,用统计计算的值来做为验证的条件,如来自某个设备或者IP的申请次数大于某个值数据分析

  • 关联规则,指用户在进行了某个操做以后,又执行另一个操做,带来的风险。例如,修改帐号密码后,进行交易操做it

  • 行为规则,指用户的异常行为,例如用户在常驻地址或者某个特殊的时间如深夜,进行了交易操做,通常也认为具有必定的风险

如如有侵权,请联系删除
参考资料:

基于Apache Flink 和规则引擎的实时风控解决方案

基于规则的风控系统

相关文章
相关标签/搜索