数据清理,项目成功的秘诀所在

全文共2134字,预计学习时长6分钟 图源:towardsdatascience   数据清理占到数据科学家工作时间的很大一部分,原始数据必须经过处理才能使用,因而数据准备是数据科学中最重要也是首要的部分,它包括数据预处理和数据整理。   原始数据的来源纷杂,不适合直接进行分析。例如,重复的条目,或者可能在记录客户的电子邮件id时出现了打字错误,或者有一些调查员遗留下来的问题。对于未清理的数据集,
相关文章
相关标签/搜索