爬虫-爬取智联招聘

时间 2021-01-05

原文原文链接

1、直接模拟浏览器爬取时，发现爬取不到相关数据，查看爬取信息，发现需要的信息在js文件中 2、获取js文件的请求URL 3、点击每一页，发现URL的区别仅仅在于start的不同，并且每一页有90条数据 4、爬取到js文件所有数据，发现js文件数据权威json格式 5、下载jsonpath库，pip install jsonpath提取信息 6、将jsonpath表达式提取的信息存进文档里面，下载l