数据预处理

Data Cleansing 空值 不一致性 冗余数据 数据类型 缺失数据:  离群点分析:ROF,A点到临近点的值比上B点到临近点距离的值 重复数据:人口信息判断是否相同用滑动窗口    Data Transformation Now we have an eror free dataset Stil needs to be standardized Type Conversion:编码方式(N
相关文章
相关标签/搜索