小项目-数据处理篇:pandas进行工做相关数据清洗

先看看咱们今天要处理的数据,爬取的成果: 工做信息7000多条 租房信息差很少6w条 本章任务: 一、去重工做地址,获取地址坐标(高德) 二、去重公司,获取公司状况 三、工做筛选,因为智联上爬取的工做,好多事工做内容里有python,只用python谢谢脚本啥的,实际标题上找的是java啊,php啊,这样的工做要删掉 四、剔除数据异常值,过大太小,NA值 五、工做根据,工做,公司状况,工做内容,技
相关文章
相关标签/搜索