金融风控竞赛笔记2-使用EDA粗略分析数据

查看缺失值 data_train.isnull().any().sum() # how many column is null 查看缺失特征中缺失率大于5%的特征 缺失列的可视化: 这里缺失值很小,可以根据各列情况选择填充。 另外可以横向比较,如果在数据集中,某些样本数据的大部分列都是缺失的且样本足够的情况下可以考虑删除。 查看训练集测试集中特征属性只有一值的特征 查看特征的数值类型有哪些,对象类
相关文章
相关标签/搜索