Python爬虫之Scrapy数据保存MongoDB
程序员文章站
2022-05-06 18:47:15
...
Python爬虫之Scrapy数据保存MongoDB
首先在Pipelines.py中创建一个类:
class MongoPipline(object):
def __init__(self, mongo_url, mongo_db):
self.mongo_url = mongo_url
self.mongo_db = mongo_db
@classmethod
def from_crawler(cls, crawler):
return cls(
mongo_url=crawler.settings.get('MONGO_URL'),
mongo_db=crawler.settings.get('MONGO_DB')
)
def open_spider(self, spider):
self.client = pymongo.MongoClient(self.mongo_url)
self.db = self.client[self.mongo_db]
def process_item(self, item, spider):
# name =item.__class__.__name__
self.db['Article'].insert(dict(item))
return item
def close_spider(self, spider):
self.client.close()
在Settings.py文件中加入MongoDB的地址和数据库如:
MONGO_URL = 'localhost'
MONGO_DB = 'Article'
上一篇: 房多多scrapy爬虫实例
推荐阅读
-
Python 爬虫 之 Selenium 模拟打开操作浏览器爬取斗鱼全部视播相关信息,并json保存信息
-
python爬虫框架scrapy实战之爬取京东商城进阶篇
-
python爬虫框架scrapy实战之爬取京东商城进阶篇
-
Python爬虫框架Scrapy实战之批量抓取招聘信息
-
Python之Scrapy爬虫框架安装及使用详解
-
Python爬虫系列教程04之通过Xpath解析网页数据
-
Python爬虫之xpath数据解析
-
Python爬虫 之数据解析之xpath
-
Python3爬虫(十) 数据存储之非关系型数据库MongoDB
-
python中urllib2与BeautifulSoup爬取数据保存MongoDB