python -- 拉勾网爬虫模拟登陆

时间 2019-12-10

原文原文链接

入门爬虫一段时间，最近在作一个拉勾网的数据爬虫分析，项目也快接近尾声了，因而抽个时间写一下这个项目中遇到的一些问题。html 目前拉勾网的反爬虫机制仍是能够的，一开始用scrapy shell 分析拉勾网，发现拉勾网要校验useragent，而后访问不到几回就会被重定向到登陆页面，即拉勾网会校验cookie。python 下面是模拟登录的思路：拉勾网登陆页面： https://passport.

>>阅读原文<<