欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

scrapy在start_requests中传入参数给parser

程序员文章站 2022-03-02 22:28:43
...

scrapy在start_requests中发出请求时,需要传入一些参数进行动态控制。为保证scrapy的请求的并发性,将其改为串行执行显然严重影响效率,因此不考虑采用全局变量的方法。因此可以使用在scrapy.Request中加入meta数据的方式向parse传入参数,如下代码的请求中加入了meta元素,包含regionId字段,可在parse中解析到

    def start_requests(self):
    	urlTemp='http://www.baidu.com'
        urls = [urlTemp]
        for url in urls:
            yield scrapy.Request(url=url, meta={'regionId': 0}, callback=self.parse)

    def parse(self, response):
        print(response.meta['regionId'])
相关标签: python