JavaShuo
栏目
标签
Pyspider的基本使用 -- 入门
时间 2020-01-02
标签
pyspider
基本
使用
入门
繁體版
原文
原文链接
简介
一个国人编写的强大的网络爬虫系统并带有强大的WebUI
采用Python语言编写,分布式架构,支持多种数据库后端,强大的WebUI支持脚本编辑器,任务监视器,项目管理器以及结果查看器
官方文档:
http://docs.pyspider.org/en/latest/
安装
pip install pyspider
安装失败的解决方法
启动服务
命令窗口输入pyspider
打开Web界面
浏览器输入localhost:5000
建立项目
删除项目
删除某个:设置 group 为 delete ,status 为 stop ,24小时以后自动删除
删除所有:在启动服务的路径下,找到它本身生成的data目录,直接删除目录里的全部文件
禁止证书验证
加上参数 validate_cert = False
使用方法
on_start(self)
入口方法,run的时候,默认会调用
crawl()
生成一个新的爬取请求,相似于scrapy.Request,接受的参数是ur1和callback
@every(minutes=2, seconds=30)
告诉scheduler两分30秒执行一次
@config(age=10 * 24 * 60 * 60)
告诉调度器(单位:秒)、这个请求过时时间是10天、10天以内不会再次请求
@config(priority=2)
优先级、数字越大越先执行
age写在函数里面跟写在装饰器上的区别
写在函数里面的后执行,下图实际过时时间为5秒,若函数里没有age,则为装饰器里定义的20秒
执行任务
完成脚本编写,调试无误后,先save脚本,而后返回到控制台首页
直接点击项目状态status那栏,把状态由TODO改为DEBUG或RUNNING
最后点击项目最右边的Run按钮启动项目
对接phantomjs
将
phantomjs.exe
放在Python环境根目录下,或者将所在目录添加到系统的环境变量
添加成功,启动服务时,会显示以下信息
没使用js渲染
使用js渲染
添加参数 fetch_type = 'js'
其它
rate/burst
rate:一秒钟执行的请求个数
burst:并发的数量
例如:2/五、每秒两个请求,并发数量为5,即每秒10个请求
设置渲染的web页面的高度
在源代码里修改css样式便可(#tab-web iframe)
css文件路径:python安装目录下 Lib\site-packages\pyspider\webui\static 里的 debug.min.css
相关文章
1.
Pyspider的基本使用 -- 入门
2.
pyspider入门
3.
pyspider基本使用和项目删除
4.
scureCRT使用基本入门
5.
pyspider 的使用(1)
6.
pyspider的基本操做
7.
pyspider的基本用法及原理
8.
Spring入门-基本注解的使用
9.
Xshell、Xftp的基本使用(入门)
10.
LINUX的基本使用入门
更多相关文章...
•
Redis基本安装和使用
-
Redis教程
•
Memcached入门教程
-
NoSQL教程
•
Java Agent入门实战(一)-Instrumentation介绍与使用
•
Java Agent入门实战(三)-JVM Attach原理与使用
相关标签/搜索
基本使用
pyspider
入门+基础
基础入门
xcode5的使用
使用过的
Docker的使用
入门实用
基本使用方法
mybatis 基本使用方法
MySQL教程
Spring教程
PHP教程
应用
0
分享到微博
分享到微信
分享到QQ
每日一句
每一个你不满意的现在,都有一个你没有努力的曾经。
最新文章
1.
安装cuda+cuDNN
2.
GitHub的使用说明
3.
phpDocumentor使用教程【安装PHPDocumentor】
4.
yarn run build报错Component is not found in path “npm/taro-ui/dist/weapp/components/rate/index“
5.
精讲Haproxy搭建Web集群
6.
安全测试基础之MySQL
7.
C/C++编程笔记:C语言中的复杂声明分析,用实例带你完全读懂
8.
Python3教程(1)----搭建Python环境
9.
李宏毅机器学习课程笔记2:Classification、Logistic Regression、Brief Introduction of Deep Learning
10.
阿里云ECS配置速记
本站公众号
欢迎关注本站公众号,获取更多信息
相关文章
1.
Pyspider的基本使用 -- 入门
2.
pyspider入门
3.
pyspider基本使用和项目删除
4.
scureCRT使用基本入门
5.
pyspider 的使用(1)
6.
pyspider的基本操做
7.
pyspider的基本用法及原理
8.
Spring入门-基本注解的使用
9.
Xshell、Xftp的基本使用(入门)
10.
LINUX的基本使用入门
>>更多相关文章<<