贷款违约预测-数据分析

EDA价值主要在于熟悉了解整个数据集的基本情况(缺失值,异常值),对数据集进行验证是否可以进行接下来的机器学习或者深度学习建模。 了解变量间的相互关系、变量与预测值之间的存在关系。 为特征工程做准备。 1.总体了解 查看数据集的样本个数和原始特征维度 训练集:(80w,47);测试集:(20w,47) 通过info来查看空值情况;通过describe查看各个特征一些基本统计量 2.查看数据集中特征
相关文章
相关标签/搜索