数据挖掘学习------------------1-数据准备-3-数据预处理

1.3、数据预处理 (1.数据清洗 数据清洗是通过填写缺失的值,光滑噪声数据,识别或删除离群点,并解决不一致性等方式来‘清洗’数据的。 主要任务:填充缺失值和去除噪声 1、缺失值处理 注意:缺失值并不意味着数据有错误。例如:申请信用卡时,可能要求申请人提供驾驶执照号,但他没有,允许他写“不适用”、空、等值。但后来他考过了,又来更新。所以说空值是被允许的,但是需要将这样的空值适当的进行处理或转化。
相关文章
相关标签/搜索