Python爬虫之Scrapy数据保存MongoDB

程序员文章站 2022-05-06 18:47:15

...

Python爬虫之Scrapy数据保存MongoDB

首先在Pipelines.py中创建一个类：

class MongoPipline(object):
    def __init__(self, mongo_url, mongo_db):
        self.mongo_url = mongo_url
        self.mongo_db = mongo_db

    @classmethod
    def from_crawler(cls, crawler):
        return cls(
            mongo_url=crawler.settings.get('MONGO_URL'),
            mongo_db=crawler.settings.get('MONGO_DB')
        )

    def open_spider(self, spider):
        self.client = pymongo.MongoClient(self.mongo_url)
        self.db = self.client[self.mongo_db]

    def process_item(self, item, spider):
        # name =item.__class__.__name__
        self.db['Article'].insert(dict(item))
        return item

    def close_spider(self, spider):
        self.client.close()

在Settings.py文件中加入MongoDB的地址和数据库如：

MONGO_URL = 'localhost'
MONGO_DB = 'Article'

上一篇：房多多scrapy爬虫实例

下一篇： python爬虫库scrapy简单使用实例详解

Python爬虫之Scrapy数据保存MongoDB

Python爬虫之Scrapy数据保存MongoDB

首先在Pipelines.py中创建一个类：

在Settings.py文件中加入MongoDB的地址和数据库如：

Python 爬虫之 Selenium 模拟打开操作浏览器爬取斗鱼全部视播相关信息，并json保存信息

python爬虫框架scrapy实战之爬取京东商城进阶篇

python爬虫框架scrapy实战之爬取京东商城进阶篇

Python爬虫框架Scrapy实战之批量抓取招聘信息

Python之Scrapy爬虫框架安装及使用详解

Python爬虫系列教程04之通过Xpath解析网页数据

Python爬虫之xpath数据解析

Python爬虫之数据解析之xpath

Python3爬虫（十）数据存储之非关系型数据库MongoDB

python中urllib2与BeautifulSoup爬取数据保存MongoDB

Python爬虫之Scrapy数据保存MongoDB

Python爬虫之Scrapy数据保存MongoDB

首先在Pipelines.py中创建一个类：

在Settings.py文件中加入MongoDB的地址和数据库如：

Python 爬虫 之 Selenium 模拟打开操作浏览器爬取斗鱼全部视播相关信息，并json保存信息

python爬虫框架scrapy实战之爬取京东商城进阶篇

python爬虫框架scrapy实战之爬取京东商城进阶篇

Python爬虫框架Scrapy实战之批量抓取招聘信息

Python之Scrapy爬虫框架安装及使用详解

Python爬虫系列教程04之通过Xpath解析网页数据

Python爬虫之xpath数据解析

Python爬虫 之数据解析之xpath

Python3爬虫（十） 数据存储之非关系型数据库MongoDB

python中urllib2与BeautifulSoup爬取数据保存MongoDB

Python 爬虫之 Selenium 模拟打开操作浏览器爬取斗鱼全部视播相关信息，并json保存信息

Python爬虫之数据解析之xpath

Python3爬虫（十）数据存储之非关系型数据库MongoDB