分享pipeline存储的实例代码

程序员文章站 2022-04-27 10:54:05

...

在spider中最后一个函数返回item时会scrapy会调用pipeline里面的

process_item(self, item, spider):
函数并传入item，spider等参数
在这里可以将数据进行持久化储存
我的piple代码

# -*- coding: utf-8 -*-# See: http://doc.scrapy.org/en/latest/topics/item-pipeline.htmlimport MySQLdb
import MySQLdb.cursorsfrom twisted.enterprise import adbapiclass MyPipeline(object):  ##这里的函数名于setting中的对应

    def __init__(self, dbpool):
        self.dbpool = dbpool
    @classmethod 　　 ##得到数据库的连接
    def from_settings(cls, settings):
        dbargs = dict(
                host = settings['MYSQL_HOST'],
                db = settings['MYSQL_DBNAME'],
                port = settings['MYSQL_PORT'],
                user = settings['MYSQL_USER'],
                passwd = settings['MYSQL_PASSWD'],
                charset = 'utf8',
                cursorclass = MySQLdb.cursors.DictCursor,
                use_unicode = True,
            )
        dbpool = adbapi.ConnectionPool('MySQLdb', **dbargs)return cls(dbpool)

    def process_item(self, item, spider): ##这个函数会在spider返回时调用
        d = self.dbpool.runInteraction(self._do_upinsert, item, spider)return item

    def _do_upinsert(self, conn, item, spider):
        valid = Truefor data in item:if not data:
                valid = Falseif valid: 　　　　　　　　##执行sql
            result = conn.execute(‘sql’)  if result:
                print 'added a record'else:
                print 'failed insert into table'

代码git地址：过几天会上传

以上就是分享pipeline存储的实例代码的详细内容，更多请关注其它相关文章！

分享pipeline存储的实例代码

兼容ie6浏览器的php下载文件代码分享

PostgreSQL10版本中的自增列代码实例分析

数组排序，对象排序的代码实例

VBA代码完美提取混合字符串中的英文字母、数字及中文实例

hibernate与mysql进行大文件的存储实例教程

js在数组的任意位置连接数组（代码实例）

AngularJs上传前预览图片的实例代码

微信小程序之批量上传并压缩图片的实例代码

python利用hook技术破解https的实例代码

Vue.js子组件向父组件通信的方法实例代码详解