Python网络爬虫入门:通⽤爬⾍和聚焦爬⾍

一、爬虫的简单理解 1. 什么是爬虫? 网络爬虫也叫网络蜘蛛,如果把互联网比喻成一个蜘蛛网,那么蜘蛛就是在网上爬来爬去的蜘蛛,爬虫程序通过请求url地址,根据响应的内容进行解析采集数据, 比如:如果响应内容是html,分析dom结构,进行dom解析、或者正则匹配,如果响应内容是xml/json数据,就可以转数据对象,然后对数据进行解析。 2. 爬虫有什么作用? 通过有效的爬虫手段批量采集数据,可以
相关文章
相关标签/搜索