数据挖掘学习-第二次打卡-数据EDA

目标:熟悉变量之间的相互关系,找到与预测值的联系,为后续的特征工程提供思路。 具体包括:查看数据总览,查看缺失值和异常值,了解预测值的分布,查看特征变量的分布,数字特征和类别特征分析(可视化)等。 按照资料中实现了一遍数据EDA,学习了一些可视化的技巧。详细的步骤大致记录如下。当然在最后可视化的时候也遇到了一些bug,还没有完全解决。由于图表太大,截取了几个进行展示 对于数据的初步分析(直接查看数
相关文章
相关标签/搜索