欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  后端开发

Python 中使用 MongoDB 存储爬虫数据

程序员文章站 2022-04-24 14:26:37
...
现在在做一个简单的搜索引擎,使用今日头条的新闻数据作为数据源。这些数据都是非结构性的,比较适合用 MongoDB 来进行存储。

以下为简单使用的示例。

#!/usr/bin/python
# -*- coding:utf-8 -*-
 
import pymongo
 
class documentManager(object):
    def __init__(self):
        pass
 
    def connect_mongo(self):
        client = pymongo.Connection("127.0.0.1",27017)
        db = client.data_db
        collection = db.data_collection
        mydict = {"name":"Lucy", "sex":"female","job":"nurse"}
        collection.insert(mydict)
 
        for i in collection.find({"name":"Lucy"}):
            print i
 
if __name__ == '__main__':
    manager = documentManager()
    manager.connect_mongo()