详解MySQL中InnoDB的存储文件
从物理意义上来讲,innodb表由共享表空间文件(ibdata1)、独占表空间文件(ibd)、表结构文件(.frm)、以及日志文件(redo文件等)组成。
1、表结构文件
在mysql中建立任何一张数据表,在其数据目录对应的数据库目录下都有对应表的.frm文件,.frm文件是用来保存每个数据表的元数据(meta)信息,包括表结构的定义等,.frm文件跟数据库存储引擎无关,也就是任何存储引擎的数据表都必须有.frm文件,命名方式为数据表名.frm,如user.frm. .frm文件可以用来在数据库崩溃时恢复表结构。
2、表空间文件
(1)表空间结构分析
以下为innodb的表空间结构图:
数据段即b+树的叶子节点,索引段即为b+树的非叶子节点innodb存储引擎的管理是由引擎本身完成的,表空间(tablespace)是由分散的段(segment)组成。一个段(segment)包含多个区(extent)。
区(extent)由64个连续的页(page)组成,每个页大小为16k,即每个区大小为1mb,创建新表时,先使用32页大小的碎片页存放数据,使用完后才是区的申请(innodb最多每次申请4个区,保证数据的顺序性能)
页类型有:数据页、undo页、系统页、事务数据页、插入缓冲位图页、以及插入缓冲空闲列表页。
(2)独占表空间文件
若将innodb_file_per_table设置为on,则系统将为每一个表单独的生成一个table_name.ibd的文件,在此文件中,存储与该表相关的数据、索引、表的内部数据字典信息。
(3)共享表空间文件
在innodb存储引擎中,默认表空间文件是ibdata1(主要存储的是共享表空间数据),初始化为10m,且可以扩展,如下图所示:
实际上,innodb的表空间文件是可以修改的,使用以下语句就可以修改:
innodb_data_file_path=ibdata1:370m;ibdata2:50m:autoextend
使用共享表空间存储方式时,innodb的所有数据保存在一个单独的表空间里面,而这个表空间可以由很多个文件组成,一个表可以跨多个文件存在,所以其大小限制不再是文件大小的限制,而是其自身的限制。从innodb的官方文档中可以看到,其表空间的最大限制为64tb,也就是说,innodb的单表限制基本上也在64tb左右了,当然这个大小是包括这个表的所有索引等其他相关数据。
而在使用单独表空间存储方式时,每个表的数据以一个单独的文件来存放,这个时候的单表限制,又变成文件系统的大小限制了。
以下即为不同平台下,单独表空间文件最大限度。
operating system file-size limit
win32 w/ fat/fat32 2gb/4gb
win32 w/ ntfs 2tb (possibly larger)
linux 2.4+ (using ext3 file system) 4tb
solaris 9/10 16tb
macos x w/ hfs+ 2tb
netware w/nss file system 8tb
※ 以下是mysql文档中的内容:
windows用户请注意: fat和vfat (fat32)不适合mysql的生产使用。应使用ntfs。
(4)共享表空间与独占表空间
共享表空间以及独占表空间都是针对数据的存储方式而言的。
共享表空间: 某一个数据库的所有的表数据,索引文件全部放在一个文件中,默认这个共享表空间的文件路径在data目录下。 默认的文件名为:ibdata1 初始化为10m。
独占表空间: 每一个表都将会生成以独立的文件方式来进行存储(.ibd文件,这个文件包括了单独一个表的数据内容以及索引内容)。
1)存储内容比较
使用独占表空间之后:
每个表对应的数据、索引和插入缓冲 存放在独占表空间(.idb文件)
每个表对应的撤销(undo)信息,系统事务信息,二次写缓冲等还是存放在了原来的共享表空间内(ibdata1文件)
2)特点比较
具体的共享表空间和独立表空间优缺点如下:
共享表空间:
优点:
可以放表空间分成多个文件存放到各个磁盘上(表空间文件大小不受表大小的限制,如一个表可以分布在不同的文件上)。
数据和文件放在一起方便管理。
缺点:
所有的数据和索引存放到一个文件中,则将有一个很常大的文件,虽然可以把一个大文件分成多个小文件,但是多个表及索引在表空间中混合存储,这样对于一个表做了大量删除操作后表空间中将会有大量的空隙,特别是对于统计分析,日志系统这类应用最不适合用共享表空间。
独立表空间:(在配置文件(my.cnf)中设置 innodb_file_per_table)
优点:
- 每个表都有自已独立的表空间。
- 每个表的数据和索引都会存在自已的表空间中。
- 可以实现单表在不同的数据库中移动。
- 空间可以回收
对于使用独立表空间的表,不管怎么删除,表空间的碎片不会太严重的影响性能,而且还有机会处理。
a)drop table操作自动回收表空间
b)如果对于统计分析或是日值表,删除大量数据后可以通过:alter table tablename engine=innodb;回缩不用的空间。
c) 对于使innodb-plugin的innodb使用truncate table也会使空间收缩。
5、在服务器资源有限,单表数据不是特别多的情况下, 独立表空间明显比共享方式效率更高 . 但是mysql 默认是共享表空间 。
缺点:
单表体积可能过大,如超过100个g。
3)共享表空间以及独占表空间之间的转化
修改独占空表空间配置,配置以下参数
innodb_data_home_dir = "/user/local/mysql/var" 数据库文件所存放的目录
innodb_log_group_home_dir = "/user/local/mysql/var" 日志存放目录
innodb_data_file_path=ibdata1:10m:autoextend 设置配置一个可扩展大小的尺寸为10mb的单独文件(共享数据文件),名为ibdata1。没有给出文件的位置,所以默认的是在mysql的数据目录内。
innodb_file_per_table=1 是否使用共享还是独占表空间 (1:为使用独占表空间,0:为使用共享表空间)
查看innodb_file_per_table 变量,如果为off说明所使用的是共享表空间(默认情况下,所使用的表空间为共享表空间)
对innodb_file_per_table 进行修改时,对于之前使用过的共享表空间不会影响,除非手动的去进行修改
注意:
innodb不创建目录,所以在启动服务器之前请确认所配置的路径目录存在。
做数据的移植以及备份时,要注意数据文件的完整性.
推荐阅读
-
详解Mysql中的JSON系列操作函数
-
Python中操作mysql的pymysql模块详解
-
Android开发中libs和jinLibs文件夹的作用详解
-
MySQL binlog中的事件类型详解
-
详解MySQL恢复psc文件记录数为0的解决方案
-
完美转换MySQL的字符集 解决查看utf8源文件中的乱码问题
-
mysql 查询数据库中的存储过程与函数的语句
-
Mysql启动中 InnoDB: Error: log file ./ib_logfile0 is of different size 0 5242880 bytes 的问题
-
mysql存储过程中的异常处理解析
-
Python中__init__.py文件的作用详解