python -- 拉勾网爬虫模拟登陆

入门爬虫一段时间,最近在作一个拉勾网的数据爬虫分析,项目也快接近尾声了,因而抽个时间写一下这个项目中遇到的一些问题。html 目前拉勾网的反爬虫机制仍是能够的,一开始用scrapy shell 分析拉勾网,发现拉勾网要校验useragent,而后访问不到几回就会被重定向到登陆页面,即拉勾网会校验cookie。python 下面是模拟登录的思路: 拉勾网登陆页面: https://passport.
相关文章
相关标签/搜索