Scrapy中的Request和日志分析

Scrapy.http.Request框架

自动去重,根据url的哈希值,进行去重scrapy

 

属性函数

meta(dict)       在不一样的请求之间传递数据,dictpost

priority(int)      此请求的优先级(默认为0)编码

dont_filter(boolean)  关闭自动去重url

errback(callable)    在处理请求时引起任何异常时将调用的函数spa

flags(list)        发送给请求的标志,可用于日志记录或相似目的debug

 

方法日志

copy()     返回一个新的请求,改请求是此请求的副本orm

replace()      返回一个更新对的request

 

 

 

FormRequest

scrapy框架内置了一个FormRequest类,它扩展了基类Request,具备处理HTML表单的功能

post请求的时候,使用FormRequest将数据传入formdata参数便可

 

 

 

日志使用

LOG_FILE         日志输出文件,若是为None,就打印在控制台

LOG_ENABLED        是否启用日志,默认True

LOG_ENCODING          日期编码,默认utf-8

LOG_LEVEL        日志等级,默认debug

LOG_FORMAT       日志格式

LOG_DATEFORMAT     日志日期格式

LOG_STDOUT       日志标准输出,默认False,若是True全部标准输出都将写入日志中

LOG_SHORT_NAMES     短日志名,默认为False,若是True将不输出组件名

 

通常只在settings配置文件中添加

相关文章
相关标签/搜索