erlang mnesia 数据库备份与还原
数据库在使用当中都会有数据库备份工作,当数据库发生严重错误无法启动,或者数据丢失时可以及时有效地恢复数据。文章首先介绍如何备份和还原Erlang Mnesia数据库,然后从备份、回滚两大方面深入探讨mnesia的备份机制。 备份数据库 在Mnesia启动后,可以使用
数据库在使用当中都会有数据库备份工作,当数据库发生严重错误无法启动,或者数据丢失时可以及时有效地恢复数据。文章首先介绍如何备份和还原Erlang Mnesia数据库,然后从备份、回滚两大方面深入探讨mnesia的备份机制。
备份数据库
在Mnesia启动后,可以使用mnesia:backup()备份,函数原型:
mnesia:backup(Opaque [, BackupMod]) -> ok | {error,Reason}
# 调用前,确保mnesia正常运行,保存目录存在 mnesia:backup("d:/backup.log").
还原数据库
在mnesia启动后,可以使用mnesia:restore()恢复,函数原型:
mnesia:restore(Opaque, Args) -> {atomic, RestoredTabs} |{aborted, Reason}
恢复过程相关的所有表将写锁,可在mnesia不用重启的情况下恢复数据
# 调用前,确保mnesia正常运行 mnesia:restore("d:/backup.log", []).
好了,如果只是了解如何备份和还原mnesia数据库,到这里就结束了。
如果为了更加深入了解mnesia的备份机制,那就继续往下看。
/******** 无情的分割线 ********* / 作者:没有开花的树 博客:blog.csdn.net/mycwq / ******* 无情的copy *********/
备份与回滚
下列函数用于备份数据、安装备份作为回滚:
# 执行一个包含在检查点中的表备份 mnesia:backup_checkpoint(Name, Opaque [, BackupMod]) # 激活一个覆盖全部 Mnesia 表的新检查点并且执行一次备份(备份以最大冗余度执行) mnesia:backup(Opaque [, BackupMod]) # 备份转储,从一个现存的备份创建一个新的备份。可以在不同介质之间复制备份。 mnesia:traverse_backup(Source,[SourceMod,]Target,[TargetMod,]Fun,Ac) # 从一个现存的备份恢复表 mnesia:restore(Opaque, Args) # 安装回滚,从一个现存的备份重启并且重新加载数据库表。 mnesia:install_fallback(Opaque, [Mod]) # 移除先前安装的回滚文件 mnesia:uninstall_fallback()
mnesia:backup()的备份过程的内部实现分为以下3步:
1、创建检查点:mnesia:activate_checkpoint/1
2、执行备份:mnesia:backup_checkpoint/3
3、停用检查点:mnesia:deactivate_checkpoint/1
对比来说,mnesia:backup方式比较野蛮,执行最大冗余备份,也就是备份全部数据,包括所有副本(copy)。当数据量比较大时恢复过程比较久,如果只需要备份某些重要的表数据,可以使用自己创建检查点。
创建检查点
关于检查点的概念,erlang的解释如下:
A checkpoint is a consistent view of the system. A checkpoint can be activated on a set of tables. This checkpoint can then be traversed and will present a view of the system as it existed at the time when the checkpoint was activated, even if the tables
are being or have been manipulated.
大概意思是,检查点被用以维护系统视图一致性。检查点相当于一个系统镜像,在备份过程中,即使数据发生变化,也不会影响备份内容。
检查点使用mnesia:activate_checkpoint函数创建,erlang会启动所有节点的mnesia_checkpoint进程,由mnesia_checkpoint_sup进程监督。关于这部分内容可以参考mnesia_checkpoint:init/1
mnesia_checkpoint进程主要负责监视数据变化。主要行为有add_retainer、del_retainer、add_copy、del_copy、change_copy
函数原型:mnesia:activate_checkpoint(Args) -> {ok,Name,Nodes} | {error,Reason}
参数说明:
Args参数是由下列元组构成的一个列表:
参数项 | 说明 | 默认值 |
{name,Name} | Name是检查点的名字,这个名字在关联的节点中必须是唯一的。当检查点被停用时,该名字可以重复使用。可以不用设置,系统会自动生成唯一的名字。 | {erlang:now(), erlang:node()} |
{max,MaxTabs} | MaxTabs是告诉erlang哪些表需要最大冗余备份,也就是所有副本也备份。默认值为[] | [] |
{min,MinTabs} | MinTabs是告诉erlang哪些表需要最小冗余备份,也就是只备份一个副本。建议是储存在本地节点的副本。默认值[] | [] |
{allow_remote,Bool} | Bool为false表示所有的连接保持器必须是本地的,如果涉及的表有不属于本地节点的,检查点就无法创建成功。Bool为true就是允许分配到任意节点。 | true |
{ram_overrides_dump,Bool} | 仅适用于ram_copies。选择你要备份的模式,true表示当最近记录提交到RAM的时候就记录到检查点,false表示当记录转储到DAT文件时才记录到检查点。这里要注意了,RAM的记录是应用程序运行时的数据,而DAT的记录只是mnesia启动需要加载的记录。默认值false | false |
执行备份
先看下erlang对于这块内容的解释:
The tables are backed up to external media using the backup module BackupMod. Tables with the local contents property is being backed up as they exist on the current node. BackupMod is the default backup callback module obtained by mnesia:system_info(backup_module).
大概意思是,执行备份时,erlang会备份本地表数据和表属性,还可以利用BackupMod参数将数据备份到其他存储介质。
函数原型:mnesia:backup_checkpoint(Name, Opaque [, BackupMod]) -> ok | {error,Reason}
参数说明:
Opaque参数:这参数是作为备份模块BackupMod的传入参数,在没有指定备份模块时,这个参数指的是本地文件名。
停用检查点:
简单的理解就是删了之前创建的检查点。
函数原型:mnesia:deactivate_checkpoint(Name) -> ok | {error, Reason}
这里有一点问题需要注意。检查点就算没有调用mnesia:deactivate_checkpoint/1 ,它也可能被停用。关于这个内容,这个功能,erlang的解释如下:
The checkpoint is automatically deactivated when some of the tables involved have no retainer attached to them. This may happen when nodes go down or when a replica is deleted.
大致意思是,当涉及到的任意一个表没有连接保持器(retainer)时,检查点会自动停用。节点挂了或者数据副本被删除也可能会导致检查点停用。
下面是一个手动备份的过程:
4> {ok, Name, _} = mnesia:activate_checkpoint( [ { max, [tb_message] } ] ). {ok,{{1387,505130,66000},nonode@nohost},[nonode@nohost]} 5> mnesia:backup_checkpoint( Name, "d:/backup.log", [] ). ok 6> mnesia:deactivate_checkpoint( Name ). ok
恢复数据
用于恢复之前备份过的数据,恢复过程相关的所有表将写锁,可在mnesia不用重启的情况下恢复数据
函数原型:
mnesia:restore(Opaque, Args) -> {atomic, RestoredTabs} |{aborted, Reason}
参数说明:
Opaque参数:这参数是作为备份模块BackupMod的传入参数,在没有指定备份模块时,这个参数指的是本地文件名。
Args参数是由下列元组构成的一个列表:
参数项 | 说明 |
{module, BackupMod} | BackupMod用于使用自定义的模块来处理恢复数据,忽略这个参数项则使用系统模块 |
{skip_tables, TabList} | TabList告诉erlang哪些表不需要恢复 |
{clear_tables, TabList} | TabList告诉erlang哪些表在恢复数据前要清除表中所有记录。注意了,这里不会删除表,只是恢复所有记录 |
{keep_tables, TabList} | TabList告诉erlang哪些表在恢复数据前记录不会被清除,而备份中的记录将会新增到表中。注意了,这里不会删除表,只是新增所有记录 |
{recreate_tables, TabList} | TabList告诉erlang哪些表在恢复数据前需要重新创建表。这些表将被删除然后重建。注意了,这里会删除表 |
{default_op, Operation} | Operation参数值为skip_tables,clear_tables,keep_tables或recreate_tables。这个参数用于指定erlang恢复表的默认行为,也就是说那些在没指定恢复方式的表将以这种方式处理。如果这个参数没有设置,默认是clear_tables |
回滚
首先要明确,什么是回滚,为什么要使用回滚,什么时候下要使用回滚?
还是先看下erlang对这块内容的解释:
This function is used to install a backup as fallback. The fallback will be used to restore the database at the next start-up. Installation of fallbacks requires Erlang to be up and running on all the involved nodes, but it does not matter if Mnesia is running
or not. The installation of the fallback will fail if the local node is not one of the disc resident nodes in the backup.
回滚用于在下一次系统启动时恢复数据库,也就是说安装回滚后系统不会立即恢复数据,而是等待mnesia重启后恢复数据。
为什么要使用回滚?前面一种恢复方式(restore)被作为一个单独事务执行,在恢复过程中相关的所有表写锁,如果数据库过于庞大,会影响其他程序运行,或无法成功恢复。在这种情况下,数据库必须通过安装一个回滚来恢复,然后重新启动。
使用回滚的另一种场合是当mnesia无法启动时,还可以使用回滚还恢复数据。在mnesia崩溃,也就是表结构损毁(schema)或者数据发生严重错误时,mnesia将无法启动,原来的恢复方式(restore)也无法使用。
回滚是一个分布式的操作,要么在所有数据库节点上执行,要么不执行。安装回滚要求 Erlang 所有数据库相关节点都启动和运行,就算Mnesia进程没有运行也不受影响。
函数原型:
mnesia:install_fallback(Opaque, Args) -> ok | {error,Reason}
Opaque参数:这参数是作为备份模块BackupMod的传入参数,在没有指定备份模块时,这个参数指的是本地文件名。
Args参数是由下列元组构成的一个列表:
参数项 | 说明 |
{module, BackupMod} | BackupMod用于使用自定义的模块来处理恢复数据,忽略这个参数项则使用系统模块 |
{scope, Scope} | Scope配置回滚的影响范围,既可以是全部数据库节点(global),也可以是一个本地节点(local)。默认是global。至于哪个节点是磁盘存储类型,由导入的备份文件确定。 |
{mnesia_dir, AlternateDir} | 当scope参数项为local有效。一般来说,回滚的安装都是以mnesia的默认目录为准。这里还可以通过配置AlternateDir来修改回滚的安装地址,回滚安装后这个目录就成了一个有效的mnesia目录。这个参数项是危险的,请谨慎使用,否则可能会导致数据库不一致 |
卸载回滚
还是给一个erlang解释的机会:
This function is used to de-install a fallback before it has been used to restore the database. This is normally a distributed operation that is either performed on all nodes with disc resident schema or none. Uninstallation of fallbacks requires Erlang
to be up and running on all involved nodes, but it does not matter if Mnesia is running or not. Which nodes that are considered as disc-resident nodes is determined from the schema info in the local fallback.
大概意思就是卸载回滚这个功能,用于在数据库已被恢复之前移除回滚。
卸载回滚也是一个分布式的操作,要么在所有数据库节点执行,要么不执行。安装回滚要求 Erlang 所有数据库相关节点都启动和运行,就算Mnesia进程没有运行也不受影响。
函数原型:
mnesia:uninstall_fallback(Args) -> ok | {error,Reason}
Args参数含义可以参考回滚的Args参数介绍。
文章参考:
http://blog.csdn.net/mycwq/article/details/17285693
http://www.erlang.org/doc/man/mnesia.html