爬虫-爬取智联招聘

1、直接模拟浏览器爬取时,发现爬取不到相关数据,查看爬取信息,发现需要的信息在js文件中 2、获取js文件的请求URL 3、点击每一页,发现URL的区别仅仅在于start的不同,并且每一页有90条数据 4、爬取到js文件所有数据,发现js文件数据权威json格式 5、下载jsonpath库,pip install jsonpath提取信息 6、将jsonpath表达式提取的信息存进文档里面,下载l
相关文章
相关标签/搜索