反爬虫策略

时间 2021-01-17

原文原文链接

目录一通过请求头来控制访问二通过IP限制来反爬虫三通过JS脚本来防止爬虫四配置ssl,采用绕过证书验证实现https 一通过请求头来控制访问无论是浏览器还是爬虫程序，在向服务器发起网络请求的时候，都会发过去一个头文件：headers. 请求头报文如下图所示这里面大部分的字段都是浏览器向服务器表面身份用的，对于爬虫来说，最需注意的字段就是User-Agent、Refe