两种方式爬取拉勾网职位信息的总结

时间 2020-07-18

标签两种方式拉勾职位信息总结繁體版

原文原文链接

大学毕业论文写了一个关于职位信息的爬虫，爬取了包括拉钩智联在内的许多网站，上个月拿出老代码再爬拉钩发现失效了，通过两个星期（天天大概2-3个小时）的不懈努力重写了拉钩网的爬虫，自我感受，拉钩是总多招聘网站较难爬取的，其余的58，智联之类的好像和拉钩的反爬机制简直不能比。下面说说我遇到的坑，以供你们参考git 基于HttpClient的爬虫首先经过抓包工具知道是加载方式是ajax，请求方式是jso

>>阅读原文<<