BAT机器学习特征工程工作经验总结(二)如何做数据清洗和预处理(附python代码)

这篇是展示平时工作中如何做数据清理和预处理。 一般数据清理和预处理的流程是: 数据加载与粗略查看 处理丢失的数据 处理离群点 数据统计 特征值的合并、连接 数据转换、标准化、归一化 去除常变量 下面会拿热门的铁达尼号等数据做示范: 1.数据加载鱼粗略查看 在pandas读进来数据一个train后,train的格式为DataFrame,调用下面的几个方法就可以大致了解我们得到的数据是什么,有什么特征
相关文章
相关标签/搜索