数据竞赛入门-金融风控(贷款违约预测)2、EDA

目的:html EDA价值主要在于熟悉了解整个数据集的基本状况(缺失值,异常值),对数据集进行验证是否能够进行接下来的机器学习或者深度学习建模. 了解变量间的相互关系、变量与预测值之间的存在关系。 为特征工程作准备 导入数据分析及可视化过程须要的库 import pandas as pd import numpy as np import matplotlib.pyplot as plt impo
相关文章
相关标签/搜索