机器学习——数据预处理(Preprocessing)

1、缺失值处理 删除包含缺失值的一整列 当该列种的大部分数据都缺失时可采用该方式,如果只有个别数据缺失,直接删除整列会导致大量信息丢失 填充缺失值 往缺失值中填入相关数据,例如:列均值、中位数等 填充值往往比直接删除整列数据有更好的效果 扩展填充 直接填充缺失值往往和实际的值之间有所差别,加入一列记录原始数据是否缺失可能会对预测结果有更好的效果 2、分类变量的预处理 在使用分类变量(特征)搭建机器
相关文章
相关标签/搜索