Python数据分析----数据探索

1. 数据质量分析 数据质量分析的主要任务是检查原始数据中是否存在脏数据:缺失值、异常值、不一致值、重复数据和含有特殊符号的数据。数组 1.1. 缺失分析 1)缺失的缘由: 函数 有些信息没法获取或获取的代价过大 有些信息是被遗漏 属性值不存在 2)缺失的影响 数据挖掘建模将丢失大量有用信息 数据挖掘模型所表现出的不肯定性更加显著,模型中蕴含的规律更难把握 包含空值的数据会使建模过程陷入混乱,致使
相关文章
相关标签/搜索