以豆瓣网为例，模拟登陆爬虫以及验证码处理

时间 2021-01-10

原文原文链接

在利用scrapy框架爬各种网站时，一定会碰到某些网站是需要登录才能获取信息。最近在学天善智能课堂韦玮老师的课程，python数据挖掘与分析实战，通过自己部分的代码和借鉴老师的项目，多次试验改进调试成功豆瓣的模拟登录，顺便处理了怎么自动化的处理验证码。我们大家都知道验证码的处理方式一般有几下三种：1.学习机器学习，处理图片识别

>>阅读原文<<