Python爬虫学习笔记2

urllib 基础 1)爬取到内存中 注:ignore可以规避解码细节问题防止报错。 2)爬取到本地 3)浏览器伪装 利用浏览器标识来伪装成浏览器来突破反爬 4)用户代理池 用多个浏览器标识进行伪装 若想设置每爬N次换一次代理: 例如每爬五次 2.如何批量爬取(并翻页)
相关文章
相关标签/搜索