Python爬虫系列(1)

Python爬虫系列(1) 1.什么是爬虫 请求网站并提取数据的自动化程序。 换句话就是说,我们通过编写代码,模拟成浏览器,请求目标网页,并通过代码提取符合我们查找规则的数据,保存到数据库中。 2.爬虫的基本流程 (1)发起请求 ​ 通过HTTP库向目标站点发起请求,即发起一个Request,请求可以包含额外的headers等信息,等待服务器响应。 (2)获取响应内容 ​ 如果服务器能正常响应,会
相关文章
相关标签/搜索