欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

Scrapy中的Request和日志分析

程序员文章站 2022-06-07 12:09:13
Scrapy.http.Request 自动去重,根据url的哈希值,进行去重 属性 meta(dict) 在不同的请求之间传递数据,dict priority(int) 此请求的优先级(默认为0) dont_filter(boolean) 关闭自动去重 errback(callable) 在处理请 ......

scrapy.http.request

自动去重,根据url的哈希值,进行去重

 

属性

meta(dict)       在不同的请求之间传递数据,dict

priority(int)      此请求的优先级(默认为0)

dont_filter(boolean)  关闭自动去重

errback(callable)    在处理请求时引发任何异常时将调用的函数

flags(list)        发送给请求的标志,可用于日志记录或类似目的

 

方法

copy()     返回一个新的请求,改请求是此请求的副本

replace()      返回一个更新对的request

 

 

 

formrequest

scrapy框架内置了一个formrequest类,它扩展了基类request,具有处理html表单的功能

post请求的时候,使用formrequest将数据传入formdata参数即可

 

 

 

日志使用

log_file         日志输出文件,如果为none,就打印在控制台

log_enabled        是否启用日志,默认true

log_encoding          日期编码,默认utf-8

log_level        日志等级,默认debug

log_format       日志格式

log_dateformat     日志日期格式

log_stdout       日志标准输出,默认false,如果true所有标准输出都将写入日志中

log_short_names     短日志名,默认为false,如果true将不输出组件名

 

一般只在settings配置文件中添加

Scrapy中的Request和日志分析