ML03 -- 数据预处理和特征工程

数据预处理和特征工程 数据不给力,再高级的算法都没用 数据挖掘的五大流程 1.获取数据 2.数据预处理 从数据中检测纠正或删除不准确或不适用于模型的记录的过程,让数据适应模型,匹配模型的需求。 会处理数据类型不同,数据偏态数据异常、缺失、噪点、量纲不一、重复等等 3.特征工程 将原始数据转换为更能代表预测模型的潜在问题的特征的过程。可以通过挑选最相关的特征,提取特征以及创造特征来实现。 可能面对的
相关文章
相关标签/搜索