1:建立项目json
scrapy startproject xxxscrapy
2:编写items.py文件ide
设置须要保存的数据字段xml
3:进入xxx.spiders源码
编写爬虫文件,文件里的name就是爬虫名(不一样于项目名)it
4:运行csv
scrapy crawl 爬虫名数据
scrapy crawl 爬虫名 -o json/csv/xml项目
附:文件
显示HTML源码:response.body