数据挖掘实训周报week2

本周比赛主要进行了数据的预处理阶段。 EDA价值主要在于熟悉了解整个数据集的基本情况(缺失值,异常值),对数据集进行验证是否可以进行接下来的机器学习或者深度学习建模.了解变量间的相互关系、变量与预测值之间的存在关系。 第一步先进行变量分类和缺失值处理。 缺没有的填补为0、 查看数据分布比例 剔除不好的数据分布 对异常的数据进行正态处理 之后进行的建模过程,由于选择的模型出现问题 目前还在解决 暂时
相关文章
相关标签/搜索