Scrapy.http.Request框架
自动去重,根据url的哈希值,进行去重scrapy
属性函数
meta(dict) 在不一样的请求之间传递数据,dictpost
priority(int) 此请求的优先级(默认为0)编码
dont_filter(boolean) 关闭自动去重url
errback(callable) 在处理请求时引起任何异常时将调用的函数spa
flags(list) 发送给请求的标志,可用于日志记录或相似目的debug
方法日志
copy() 返回一个新的请求,改请求是此请求的副本orm
replace() 返回一个更新对的request
FormRequest
scrapy框架内置了一个FormRequest类,它扩展了基类Request,具备处理HTML表单的功能
post请求的时候,使用FormRequest将数据传入formdata参数便可
日志使用
LOG_FILE 日志输出文件,若是为None,就打印在控制台
LOG_ENABLED 是否启用日志,默认True
LOG_ENCODING 日期编码,默认utf-8
LOG_LEVEL 日志等级,默认debug
LOG_FORMAT 日志格式
LOG_DATEFORMAT 日志日期格式
LOG_STDOUT 日志标准输出,默认False,若是True全部标准输出都将写入日志中
LOG_SHORT_NAMES 短日志名,默认为False,若是True将不输出组件名
通常只在settings配置文件中添加