Bryan直播:sklearn入门:数据预处理、模型评估、模型融合——学习笔记

1.预处理 当我们拿到一批原始数据以后,需要考虑以下问题: 1)首先要明确有多少特征,哪些是连续的,哪些是类别特征。 2)检查有没有缺失值,选择合适的缺失值填补方法,使数据保持完整。 3)对连续的数值型变量进行 标准化,使得均值为0,方差为1。 4)对类别型的特征进行 one-hot编码。 5)将需要转换成类别型数据的连续型数据进行 二值化。 6)为防止过拟合或者其他原因,选择是否要将数据进行 正
相关文章
相关标签/搜索