Python爬虫面试题整理(小白,自己备用)

1.你写爬虫的时候都遇到过什么反爬虫措施,你是怎么解决的? 通过headers反爬虫:解决策略,伪造headers 基于用户行为反爬虫:动态变化去爬取数据,模拟普通用户的行为 通过动态更改代理ip来反爬虫 基于动态页面的反爬虫:跟踪服务器发送的ajax请求,模拟ajax请求,selnium 和phtamjs 2.用的什么框架,为什么选择这个框架(我用的是scrapy框架,所以下面的问题也是针对sc
相关文章
相关标签/搜索