【说在前面】本人博客新手一枚,象牙塔的老白,职业场的小白。如下内容仅为我的看法,欢迎批评指正,不喜勿喷![握手][握手]
【再啰嗦一下】若是你对数据挖掘感兴趣,欢迎先浏览个人另外一篇随笔:数据挖掘比赛/项目全流程介绍
【再啰嗦一下】若是你对金融科技感兴趣,欢迎浏览个人另外一篇随笔:若是你想了解金融科技,不妨先了解金融科技有哪些可能?
【最后再说一下】本文结合了博主、内部赛优秀团队以及外部赛冠/亚/季军的方案分享!html
如何进行金融行业数据分析与建模,是挖掘金融行业数据价值的重要手段。金融行业数据分析与建模方法主要包括七个重要环节,每一个环节紧密相连。
python
贷款风险预测(逾期还款分三种状况:要么用户不肯意还款、要么没有钱还款、要么忘了还款)面试
根据数据集中8万用户的相关信息,预测用户将来是否会逾期还款。算法
用户基本信息、银行卡流水、信用卡帐单信息以及用户行为数据,字段内容均为脱敏数据。机器学习
Kolmogorov-Smirnov(KS)是风险评分领域经常使用的评估指标,反应模型对正负样本的辨识能力,KS越高代表模型对正负样本的辨识能力越强。
KS = max { | f(s|P) - f(s|N) | }
其中,f(s|P) 为正样本预测值的累计分布函数,f(s|N) 为负样本在预测值上的累计分布函数。
函数
经过数据可视化查看数据样本的分布以及特征的统计规律。学习
主要包括数据的缺失值处理、异常值处理、拼接、去重等基本处理。同时,还有汇率转换和单位净值*份额等基本数据操做。测试
根据类别型和数值型数据在标签上的分布进行预处理,包括标准化、归一化、离散化、平滑化、one-hot编码等。优化
若是你对金融科技感兴趣,欢迎浏览个人另外一篇博客:若是你想了解金融科技,不妨先了解金融科技有哪些可能?
若是您对数据挖掘感兴趣,欢迎浏览个人另外一篇博客:数据挖掘比赛/项目全流程介绍
若是你对智能推荐感兴趣,欢迎先浏览个人另外一篇随笔:智能推荐算法演变及学习笔记
若是您对人工智能算法感兴趣,欢迎浏览个人另外一篇博客:人工智能新手入门学习路线和学习资源合集(含AI综述/python/机器学习/深度学习/tensorflow)
若是你是计算机专业的应届毕业生,欢迎浏览个人另一篇博客:若是你是一个计算机领域的应届生,你如何准备求职面试?
若是你是计算机专业的本科生,欢迎浏览个人另一篇博客:若是你是一个计算机领域的本科生,你能够选择学习什么?
若是你是计算机专业的研究生,欢迎浏览个人另一篇博客:若是你是一个计算机领域的研究生,你能够选择学习什么?
以后博主将持续分享各大算法的学习思路和学习笔记:hello world: 个人博客写做思路编码