我是一只小小爬虫(Python编程)--第1节 什么是爬虫

1、爬虫的基本概念 爬虫:一只在网络上爬行的“蜘蛛”,这只蜘蛛用来在网络上爬取咱们想获取的信息,因此爬虫的定义大概是:html 请求网站并提取数据的自动化程序。git 从定义中能够看出,咱们首先要作的是向网站发送请求,模拟浏览器浏览网页的模式,从而获取数据,此时获取的数据实际上是html代码文本以及图片等,接下来就是筛选咱们须要的数据,梳理好咱们须要的数据以后,就是要分类,按需存储咱们的想要的数据
相关文章
相关标签/搜索