Python爬虫——8.scrapy—深度爬取

还是以前面文章提到的爬取智联招聘数据为例,首先分析一下网页特征,要爬取的数据职位名称、公司名称、职位月薪这些数据是直接渲染在网页中的,所谓的深度爬取则是在只抓取一个url的情况下获取该页面上其他页面的链接,然后将这些url加入到urljoin()中进行一一爬取。 以下是简单的scrapy框架的底层图解: 1.首先,让我们先创建一个scrapy项目: python2 -m scrapy startp
相关文章
相关标签/搜索