urllib,request 设置代理

 通常防止爬虫被反主要有以下几个策略: 1.动态设置User-Agent(随机切换User-Agent,模拟不同用户的浏览器信息) 2.使用IP地址池:v*n和代理IP,现在大部分网站都是根据IP来ban的。 3.禁用Cookies(也就是不启用cookies middleware,不向Server发送cookies,有些网站通过cookie的使用发现爬虫行为) 4.可以通过COOKIES_ENA
相关文章
相关标签/搜索