什么是定向爬取技术,Python爬虫的定向爬取技术需解决哪些问题?

一、什么是爬虫的定向爬取技术 通俗来说,爬虫的定向爬取技术就是根据设置的主题,对要爬取的网址或者网页中的内容进行筛选。比如我们可以使用正则表达式进行筛选等,筛选之后,再爬取对应的网址中的内容,并可以根据爬取到的内容再次进行筛选。 众所周知,互联网的信息是海量的,在一个相对较短的时间内要尽可能多的爬取到我们感兴趣的信息,则不可能漫无目的地去爬取,如果漫无目的地去爬取,则必然会浪费大量的时间,所以我们
相关文章
相关标签/搜索