基于scrapy的redis安装和配置方法
程序员文章站
2023-02-21 20:27:53
在定向爬虫的制作过程中,使用分布式爬取技术可以显著提高爬取效率。而 Redis 配合 Scrapy 是实现分布式爬取的基础。
Redis 是一个高性能的 Key-Valu...
在定向爬虫的制作过程中,使用分布式爬取技术可以显著提高爬取效率。而 Redis 配合 Scrapy 是实现分布式爬取的基础。
Redis 是一个高性能的 Key-Value 数据库,它把数据保存在内存里。因此可以有非常快的数据读写速度。
scrapy-redis 的安装
pip install scrapy-redis easy_install scrapy-redis
下载
版本推荐
stable 3.0.2
运行redis
redis-server redis.conf
清空缓存
redis-cli flushdb
scrapy配置redis
settings.py配置redis
SCHEDULER = "scrapy_redis.scheduler.Scheduler" SCHEDULER_PERSIST = True SCHEDULER_QUEUE_CLASS = 'scrapy_redis.queue.SpiderPriorityQueue' REDIS_URL = None # 一般情况可以省去 REDIS_HOST = '127.0.0.1' # 也可以根据情况改成 localhost REDIS_PORT = 6379
在scrapy中使用scrapy-redis
spider 继承RedisSpider
class tempSpider(RedisSpider) name = "temp" redis_key = ''temp:start_url"
以上这篇基于scrapy的redis安装和配置方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。
推荐阅读
-
无法在com+ 目录中安装和配置程序集 错误:-2146233087的解决方法[已测]
-
Springboot 2.0.x 集成基于Centos7的Redis集群安装及配置
-
基于scrapy的redis安装和配置方法
-
Redis5.0怎么安装?Linux下载安装Redis的操作步骤和配置教程
-
监控软件Nagios的服务器端在Linux系统上的安装和配置方法
-
php扩展memcached和memcache的安装配置方法
-
Django中redis的使用方法(包括安装、配置、启动)
-
CentoS6.5环境下redis4.0.1(stable)安装和主从复制配置方法
-
CentOS7安装配置 Redis的方法步骤
-
Linux下安装JDK和Eclipse的配置方法