爬虫学习笔记5-常见的反爬虫手段和解决思路

时间 2020-12-27

原文原文链接

一、常见基于身份识别进行反爬 1、通过headers字段来反爬服务器通过 headers字段进行判断是否为爬虫 1.1 通过headers中的User-Agent字段来反爬反爬原理：爬虫默认情况下没有User-Agent，而是使用模块默认设置解决方法：请求之前添加User-Agent即可；更好的方式是使用User-Agent池来解决（收集一堆User-Agent的方式，或者是随机生成Use

>>阅读原文<<