欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

Scrapy start_requests

程序员文章站 2022-03-02 22:25:43
...

Scrapy 中的起始请求 通过start_requests 函数 实现  源码如下:

def start_requests(self):
    for url in self.start_urls:
        yield Request(url, dont_filter=True)

起始请求中url列表如果有重复的url 这里是不做去重处理的

如果携带参数 dont_filter=True,start_urls 中的 URL 在首次请求时不会加入过滤列表中,相同 url 再次请求时由于不存在于过滤列表中,会导致重复请求。

 

我们可以根据自己的需要 重写此方法,来实现起始请求的其他功能 或者加入头部信息  或者是其他参数 等等