欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

实现MySQL回滚的Python脚本的编写教程

程序员文章站 2024-02-26 13:36:28
操作数据库时候难免会因为“大意”而误操作,需要快速恢复的话通过备份来恢复是不太可能的,因为需要还原和binlog差来恢复,等不了,很费时。这里先说明下因为delete 操作...

操作数据库时候难免会因为“大意”而误操作,需要快速恢复的话通过备份来恢复是不太可能的,因为需要还原和binlog差来恢复,等不了,很费时。这里先说明下因为delete 操作的恢复方法:主要还是通过binlog来进行恢复,前提是binlog_format必须是row格式,否则只能通过备份来恢复数据了。
方法:

条件:开启binlog,format为row。

步骤:

1.通过mysql自带工具mysqlbinlog 指定导出操作的记录:

mysqlbinlog 
--no-defaults 
--start-datetime='2012-12-25 14:56:00' 
--stop-datetime='2012-12-25 14:57:00' 
-vv mysql-bin.000001 > /home/zhoujy/restore/binlog.txt 

2.数据取出来之后,需要把数据解析反转,原始数据:

### delete from test.me_info 
### where 
###  @1=2165974 /* int meta=0 nullable=0 is_null=0 */ 
###  @2='1984:03:17' /* date meta=0 nullable=1 is_null=0 */ 
###  @3=null /* date meta=765 nullable=1 is_null=1 */ 
###  @4=2012-10-25 00:00:00 /* datetime meta=0 nullable=0 is_null=0 */ 
###  @5='' /* varstring(765) meta=765 nullable=1 is_null=0 */ 
###  @6=0 /* tinyint meta=0 nullable=1 is_null=0 */ 
###  @7='' /* varstring(765) meta=765 nullable=1 is_null=0 */ 
###  @8=-1 (4294967295) /* int meta=0 nullable=1 is_null=0 */ 
###  @9=0 /* mediumint meta=0 nullable=1 is_null=0 */ 
###  @10=null /* mediumint meta=0 nullable=1 is_null=1 */ 
###  @11=2 /* tinyint meta=0 nullable=1 is_null=0 */ 
###  @12=0 /* tinyint meta=0 nullable=1 is_null=0 */ 
###  @13='' /* varstring(765) meta=765 nullable=1 is_null=0 */ 
###  @14='' /* varstring(765) meta=765 nullable=1 is_null=0 */ 
###  @15=0 /* mediumint meta=0 nullable=1 is_null=0 */ 
###  @16=320 /* int meta=0 nullable=1 is_null=0 */ 
…………………… 
…………………… 
…………………… 

row格式的binlog记录的格式如上面所示,需要做的工作就是吧delete的操作转换成insert操作,发上面的都是有一定规律的,并且需要注意的是:

1、字段类型 datetime 日期。在日志中保存的格式为 @4=2012-10-25 00:00:00,需要将2012-10-25 00:00:00加上引号。

2、负数。在日志中保存的格式为 @1=-1 (4294967295), -2(4294967294),-3(4294967293),需要将()里面的数据去掉,只保留@1=-1。

3、转义字符集。如:'s,\,等。

上面3点清楚之后,可以写一个脚本(水平有限,在提升中,写的不好看):

#!/bin/env python 
# -*- encoding: utf-8 -*- 
#------------------------------------------------------------------------------- 
# name:    restore.py 
# purpose:   通过binlog恢复delete误操作数据 
# author:   zhoujy 
# created:   2012-12-25 
# update:   2012-12-25 
# copyright:  (c) mablevi 2012 
# licence:   zjy 
#------------------------------------------------------------------------------- 
def read_binlog(file,column_num): 
  f=open(file) 
  num = '@'+str(column_num) 
  while true: 
    lines = f.readline() 
    if lines.strip()[0:3] == '###': 
      lines=lines.split(' ',3) 
      if lines[1] == 'delete' and lines[2] =='from':      #该部分替换delete为insert 
        lines[1] = "insert" 
        lines[2] = 'into' 
        lines[-1] = lines[-1].strip() 
      if lines[1].strip() == 'where': 
        lines[1] = 'values (' 
      if ''.join(lines).find('@') <> -1 and lines[3].split('=',1)[0] <> num:     #num为列数,要是小于最大的列数,后面均加, 
        lines[3] = lines[3].split('=',1)[-1].strip() 
        if lines[3].strip('\'').strip().find('\'') <> -1: 
          lines[3] = lines[3].split('/*')[0].strip('\'').strip().strip('\'').replace('\\','').replace('\'','\\\'') #这里过滤掉转义的字符串 
          lines[3] = '\'' + lines[3] + '\',' 
        elif lines[3].find('int meta') <> -1:        #过滤int类型的字段为负数后带的(),正数不受影响 
          lines[3] = lines[3].split('/*')[0].strip() 
          lines[3] = lines[3].split()[0] + ',' 
        elif lines[3].find('null') <> -1: 
          lines[3] = lines[3].split('/*')[0].strip() 
          lines[3] = lines[3] + ',' 
        else: 
          lines[3] = lines[3].split('/*')[0].strip('\'').strip().strip('\'').replace('\\','').replace('\'','\\\'') #这里过滤掉转义的字符串 
          lines[3] = '\'' + lines[3].strip('\''' ') + '\',' 
      if ''.join(lines).find('@') <> -1 and lines[3].split('=',1)[0] == num:     #num为列数,要是小于最大的列数,后面均加); 
        lines[3] = lines[3].split('=',1)[-1].strip() 
        if lines[3].find('\'') <> -1: 
          lines[3] = lines[3].split('/*')[0].strip('\'').strip().strip('\'').replace('\\','').replace('\'','\\\'') #同上 
          lines[3] = '\'' + lines[3] + '\');' 
        elif lines[3].find('int meta') <> -1:        #同上 
          lines[3] = lines[3].split('/*')[0].strip() 
          lines[3] = lines[3].split(' ')[0] + ');' 
        elif lines[3].find('null') <> -1: 
          lines[3] = lines[3].split('/*')[0].strip() 
          lines[3] = lines[3] + ');' 
        else: 
          lines[3] = lines[3].split('/*')[0].strip('\'').strip().strip('\'').replace('\\','').replace('\'','\\\'') #同上 
          lines[3] = '\'' + lines[3].strip('\''' ') + '\');' 
      print ' '.join(lines[1:]) 
    if lines == '': 
      break 
if __name__ == '__main__': 
  import sys 
  read_binlog(sys.argv[1],sys.argv[2]) 

执行脚本:
python restore.py binlog.txt 36 > binlog.sql

命令行中的36 表示 需要还原的表的字段有36个,效果:

insert into test.me_info 
values ( 
 2123269, 
 '1990:11:12', 
 null, 
 2, 
 '', 
 0, 
 '', 
 -1, 
 0, 
 340800, 
 1, 
 0, 
 '', 
…… 
…… 
 1, 
 null 
); 

最后还原:

mysql test < binlog.sql