欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

Scrapy原理讲解

程序员文章站 2024-01-19 19:15:10
...

一.scrapy爬虫流程

Scrapy原理讲解

scheduler拿到从spiders里面拿到需要爬取的URL并通过Scrapy Engine将其交给下载中间件处理交给Downloader下载。
Downloader通过下载中间件将数据交给引擎,引擎通过爬虫中间件,将数据交给爬虫。
爬虫提取数据交给引擎,引擎通过Pipeline进行数据的存储。
spider通过提取的url地址构造request对象通过爬虫中间交给引擎交给调度器

二 .scrapy项目

Scrapy原理讲解

相关标签: 爬虫