零基础如何做Python爬虫

首先我们来了解爬虫的基本原理及过程 大部分爬虫都是按“发送请求——获得页面——解析页面——抽取并储存内容”这样的流程来进行,这其实也是模拟了我们使用浏览器获取网页信息的过程。 简单来说,我们向服务器发送请求后,会得到返回的页面,通过解析页面之后,我们可以抽取我们想要的那部分信息,并存储在指定的文档或数据库中。 在这部分你可以简单了解 HTTP 协议及网页基础知识,比如 POSTGET、HTML、C
相关文章
相关标签/搜索