Python3网络爬虫——爬虫基本原理

1、网络爬虫概述 爬虫就是 请求 网站并 提取 数据的 自动化 程序 网络爬虫 (Web Spider),又被称为网页蜘蛛,是一种按照一定的规则,自动地抓取网站信息的程序或者脚本。 网络蜘蛛 是通过网页的链接地址来寻找网页,从网站某一个页面开始,读取网页的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻找下一个网页,这样一直循环下去,直到把这个网站所有的网页都抓取完为止。 2、爬虫基本流程
相关文章
相关标签/搜索