WebMagic 剖析

WebMagic  首先,爬虫的本质:基于Http协议请求目标地址获取响应结果解析并存储。 01 导语 1、爬虫基础知识 2、优秀国产开源爬虫框架webmagic剖析 02 爬虫基础 1、爬虫的本质 爬虫的本质:基于Http协议请求目标地址获取响应结果解析并存储。 2、HTTP请求 请求头(Request Headers):包装了http请求的基本信息,比较重要的如:user-agent、refe
相关文章
相关标签/搜索