利用Python+PowerBi进行拉勾网杭州站的数据采集及可视化分析之数据清洗篇

我对数据清洗的理解是: 1、确认数据有效性  2,清除异常数据 3,优化数据结构 非常粗糙的理解哈〜  1是因为如果数据无效,爬下来都是错的......后面的也没事意义 2是可能需要的去重啊,多余的介词啊,符号啊,也应该洗一洗 3方便细分。 上一篇利用Python的+ PowerBi拉进行网勾杭州站网站的数据采集及可视化分析之爬虫篇  中,我已经完成了爬虫。 大概是爬下了7万多条数据。 1,确认数
相关文章
相关标签/搜索