网站反爬虫策略

    反爬虫策略,表面上看似乎跟WEB系统优化没有关系,经过分析,发现该策略是可以归到WEB性能优化的系列之中。     通过分析apache日志发现,某系统40%的带宽和服务器资源都消耗在爬虫上,如果除去10%-15%搜索引擎的爬虫,做好反爬虫策略,能节省20%-25%的资源,其实是变向优化了web系统。 一、爬虫请求与正常用户请求的区别     爬虫请求是类似httpClient的机制或cu
相关文章
相关标签/搜索