金融风险管理:赛题理解

数据分析四大步骤 赛题:以预测用户贷款是否违约为任务。数据来自某信贷平台的贷款记录,总数据量超过120w,包含47列变量信息,其中15列为匿名变量。为了保证比赛的公平性,将会从中抽取80万条作为训练集,20万条作为测试集A,20万条作为测试集B,同时会对employmentTitle、purpose、postCode和title等信息进行脱敏。 赛题数据 初始特征有许多,部分展示如下。 评价标准:
相关文章
相关标签/搜索