spss数据的预处理

数据清洗:对获取的原始数据中的缺失值进行填补,分析数据中是否存在离群点,对噪声数据进行平滑等,并利用适当的技术对这些“脏数据”进行清洗,提高数据的质量。 数据集成:将来自不同数据源的数据进行合并,去除可能存在的冗余数据,保证数据的一致性。 数据变换:对数据进行规范化处理,将数据转换为有利于数据挖掘的形式。 数据规约::将数据集转换为相对简单的形式。若需要对离散型数据进行挖掘需要先将连续型数据量化
相关文章
相关标签/搜索