数据预处理--数据检查、变量标准化、分布变换、构造特征、特征筛选

1、数据检查html 1)缺失值算法 有时候是null,有时候全是0,这个须要比想象中更仔细,由于取数的同窗们有时候会默认填充0,有时候是由于数据库迁移,产品刚刚发布因此太远的数据没有等缘由形成的,这些须要及时确认数据库 对于有些变量仅对特定的人有值,(好比说理财的产品偏好,固然只有买了理财的人才会有偏好数据能够分析),能够给没有这个值的人填充一个数值,能够是999这样这个字段不会取到的大值(可是
相关文章
相关标签/搜索