爬虫去重 : 两种去重方法、增量爬虫scrapy案例:nba

1、cmd(scrapy startproject nba)创建好项目之后,创建spider文件 配置setting文件 2、创建好spider类 2、判断要不要使用中间件selenium,如果页面是ajax请求,js代码,需要点击等要使用selenium。会返回html给spider 然后后测试一下 3、如果不需要seleniu也要先测试 4、分页,想办法获取最大页码,最简单的办法就是在url页
相关文章
相关标签/搜索