Python学习之网络爬虫01--网络爬虫的定义

Python学习之网络爬虫01–网络爬虫的定义 概念: 网络爬虫就是自动从互联网中定向或者不定项地采集信息的一种程序。 定向:即聚焦,我们知道从哪个网站中采,具体要采哪些信息,是一个有目的的采集。 不定向:类似搜索引擎,没有固定的要求,只是纯粹的想要去搜集。 网络爬虫有很多种,常用的有通用网络爬虫、聚焦网络爬虫、深层页面爬虫。 通用网络爬虫:我不知道我要爬取什么,记录式的去爬取。 聚焦网络爬虫:我
相关文章
相关标签/搜索