咨询行业中常常接触到文本类信息,不管是分词作词云图,仍是整理编码分析用,都很是具备价值。框架
本文将记录使用scrapy框架爬取京东IPhone11评论的过程,因为一边学习一边实践,更新稍慢请见谅。iphone
1.scrapy开始建立项目:scrapy
scrapy startproject projectNameide
2. 进入建立的项目目录:学习
cd projectName编码
3.以默认的basic模板建立第一个爬虫:3d
scrapy genspider spiderName www.hostDomain.comblog
好的,这样基本目录就创建起来了,目录结构以下:ip
接下来在与spider同名文件(iphone11.py)里就能够编辑正式爬虫代码了。模板