python使用代理处理反爬抓取微信文章

时间 2021-01-11

原文原文链接

1.分析网页确定思路我们这次准备爬取搜狗的微信搜索页面的结果，以风景为例：可以看到这和我们之前爬取过的案例几乎类似，没什么新意，但是这里有一个比较神奇的地方就是10页以后的内容需要扫码登录微信才能查看另外，在请求次数过多的时候还会出现封禁 ip 的情况，对应我们页面的状态码就是出现 302 跳转思路梳理： (1)requests 请求目标站点，得到索引页的源码，返回结果 (2)如果遇到

>>阅读原文<<