欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

MySQL的InnoDB引擎入门学习教程

程序员文章站 2024-02-26 21:14:40
mysql发展到今天,innodb引擎已经作为绝对的主力,除了像大数据量分析等比较特殊领域需求外,它适用于众多场景。然而,仍有不少开发者还在“执迷不悟”的使用myisam引...

mysql发展到今天,innodb引擎已经作为绝对的主力,除了像大数据量分析等比较特殊领域需求外,它适用于众多场景。然而,仍有不少开发者还在“执迷不悟”的使用myisam引擎,觉得对innodb无法把握好,还是myisam简单省事,还能支持快速count(*)。本文是由于最近几天帮忙处理discuz论坛有感而发,希望能对广大开发者有帮助。

1. 快速认识innodb
innodb是mysql下使用最广泛的引擎,它是基于mysql的高可扩展性和高性能存储引擎,从5.5版本开始,它已经成为了默认引擎。
innodb引擎支持众多特性:

a) 支持acid,简单地说就是支持事务完整性、一致性;
b) 支持行锁,以及类似oracle的一致性读,多用户并发;
c) 独有的聚集索引主键设计方式,可大幅提升并发读写性能;
d) 支持外键;
e) 支持崩溃数据自修复;
innodb有这么多特性,比myisam来的优秀多了,还犹豫什么,果断的切换到innodb引擎吧 :)

2. 修改innodb配置选项
可以选择官方版本,或者percona的分支,如果不知道在哪下载,就google吧。
安装完mysql后,需要适当修改下my.cnf配置文件,针对innodb相关的选项做一些调整,才能较好的运行innodb。
相关的选项有:

#innodb存储数据字典、内部数据结构的缓冲池,16mb 已经足够大了。
innodb_additional_mem_pool_size = 16m

#innodb用于缓存数据、索引、锁、插入缓冲、数据字典等
#如果是专用的db服务器,且以innodb引擎为主的场景,通常可设置物理内存的50%
#如果是非专用db服务器,可以先尝试设置成内存的1/4,如果有问题再调整
#默认值是8m,非常坑x,这也是导致很多人觉得innodb不如myisam好用的缘故
innodb_buffer_pool_size = 4g

#innodb共享表空间初始化大小,默认是 10mb,也非常坑x,改成 1gb,并且自动扩展
innodb_data_file_path = ibdata1:1g:autoextend

#如果不了解本选项,建议设置为1,能较好保护数据可靠性,对性能有一定影响,但可控
innodb_flush_log_at_trx_commit = 1

#innodb的log buffer,通常设置为 64mb 就足够了
innodb_log_buffer_size = 64m

#innodb redo log大小,通常设置256mb 就足够了
innodb_log_file_size = 256m

#innodb redo log文件组,通常设置为 2 就足够了
innodb_log_files_in_group = 2

#启用innodb的独立表空间模式,便于管理
innodb_file_per_table = 1

#启用innodb的status file,便于管理员查看以及监控等
innodb_status_file = 1

#设置事务隔离级别为 read-commited,提高事务效率,通常都满足事务一致性要求
transaction_isolation = read-committed 
在这里,其他配置选项也需要注意:

#设置最大并发连接数,如果前端程序是php,可适当加大,但不可过大
#如果前端程序采用连接池,可适当调小,避免连接数过大
max_connections = 60

#最大连接错误次数,可适当加大,防止频繁连接错误后,前端host被mysql拒绝掉
max_connect_errors = 100000

#设置慢查询阀值,建议设置最小的 1 秒
long_query_time = 1

#设置临时表最大值,这是每次连接都会分配,不宜设置过大 max_heap_table_size 和 tmp_table_size 要设置一样大
max_heap_table_size = 96m
tmp_table_size = 96m

#每个连接都会分配的一些排序、连接等缓冲,一般设置为 2mb 就足够了
sort_buffer_size = 2m
join_buffer_size = 2m
read_buffer_size = 2m
read_rnd_buffer_size = 2m

#建议关闭query cache,有些时候对性能反而是一种损害
query_cache_size = 0

#如果是以innodb引擎为主的db,专用于myisam引擎的 key_buffer_size 可以设置较小,8mb 已足够
#如果是以myisam引擎为主,可设置较大,但不能超过4g
#在这里,强烈建议不使用myisam引擎,默认都是用innodb引擎
key_buffer_size = 8m

#设置连接超时阀值,如果前端程序采用短连接,建议缩短这2个值
#如果前端程序采用长连接,可直接注释掉这两个选项,是用默认配置(8小时)
interactive_timeout = 120
wait_timeout = 120

3. 开始使用innodb引擎
修改完配置文件,即可启动mysql。启动完毕后,在mysql的datadir目录下,若产生以下几个文件,则表示应该可以使用innodb引擎了。

-rw-rw---- 1 mysql mysql 1.0g sep 21 17:25 ibdata1
-rw-rw---- 1 mysql mysql 256m sep 21 17:25 ib_logfile0
-rw-rw---- 1 mysql mysql 256m sep 21 10:50 ib_logfile1

登录mysql后,执行命令,确认已启用innodb引擎:

(root:imysql.cn:thu oct 15 09:16:22 2009)[mysql]> show engines;
+------------+---------+----------------------------------------------------------------+--------------+------+------------+
| engine   | support | comment                            | transactions | xa  | savepoints |
+------------+---------+----------------------------------------------------------------+--------------+------+------------+
| innodb   | yes   | supports transactions, row-level locking, and foreign keys   | yes     | yes | yes    |

接下来创建一个innodb表:

(root:imysql.cn:thu oct 15 09:16:22 2009)[mysql]> 
create table my_innodb_talbe(
id int unsigned not null auto_increment,
name varchar(20) not null default '',
passwd varchar(32) not null default '',
primary key(id),
unique key `idx_name`(name)
) engine = innodb;

有几个和mysql(尤其是innodb引擎)数据表设计相关的建议,希望开发者朋友能遵循:

a) 所有innodb数据表都创建一个和业务无关的自增数字型作为主键,对保证性能很有帮助;
b) 杜绝使用text/blob,确实需要使用的,尽可能拆分出去成一个独立的表;
c) 时间戳建议使用 timestamp 类型存储;
d) ipv4 地址建议用 int unsigned 类型存储;
e) 性别等非是即非的逻辑,建议采用 tinyint 存储,而不是 char(1);
f) 存储较长文本内容时,建议采用json/bson格式存储;

4.了解innodb的存储结构
从物理意义上来讲,innodb表由共享表空间、日志文件组(redo文件组)、表结构定义文件组成。若将innodb_file_per_table设置为on,则系统将为每一个表单独的生成一个table_name.ibd的文件,在此文件中,存储与该表相关的数据、索引、表的内部数据字典信息。表结构文件则以.frm结尾,这与存储引擎无关。

  以下为innodb的表空间结构图:

MySQL的InnoDB引擎入门学习教程

在innodb存储引擎中,默认表空间文件是ibdata1,初始化为10m,且可以扩展,如下图所示:

MySQL的InnoDB引擎入门学习教程

实际上,innodb的表空间文件是可以修改的,使用以下语句就可以修改:

innodb_data_file_path=ibdata1:370m;ibdata2:50m:autoextend

  使用共享表空间存储方式时,innodb的所有数据保存在一个单独的表空间里面,而这个表空间可以由很多个文件组成,一个表可以跨多个文件存在,所以其大小限制不再是文件大小的限制,而是其自身的限制。从innodb的官方文档中可以看到,其表空间的最大限制为64tb,也就是说,innodb的单表限制基本上也在64tb左右了,当然这个大小是包括这个表的所有索引等其他相关数据。

  而在使用单独表空间存储方式时,每个表的数据以一个单独的文件来存放,这个时候的单表限制,又变成文件系统的大小限制了。

  以下即为不同平台下,单独表空间文件最大限度。

operating system  file-size limit
win32 w/ fat/fat32  2gb/4gb
win32 w/ ntfs          2tb (possibly larger)
linux 2.4+          (using ext3 file system) 4tb
solaris 9/10          16tb
macos x w/ hfs+         2tb
netware w/nss file system  8tb

以下是mysql文档中的内容:
windows用户请注意: fat和vfat (fat32)不适合mysql的生产使用。应使用ntfs。

共享表空间与独占表空间可以通过参数innodb_file_per_table来转换,若为1,则开启独占表空间,否则,开启共享表存储。

在服务器资源有限,单表数据不是特别多的情况下, 独立表空间明显比共享方式效率更高 . 但是mysql 默认是共享表空间 。

具体的共享表空间和独立表空间优缺点如下:

共享表空间:
优点:
可以放表空间分成多个文件存放到各个磁盘上(表空间文件大小不受表大小的限制,如一个表可以分布在不同步的文件上)。数据和文件放在一起方便管理。
缺点:
所有的数据和索引存放到一个文件中以为着将有一个很常大的文件,虽然可以把一个大文件分成多个小文件,但是多个表及索引在表空间中混合存储,这样对于一个表做了大量删除操作后表空间中将会有大量的空隙,特别是对于统计分析,日值系统这类应用最不适合用共享表空间。

独立表空间:在配置文件(my.cnf)中设置: innodb_file_per_table

优点:
1.  每个表都有自已独立的表空间。
2.  每个表的数据和索引都会存在自已的表空间中。
3.  可以实现单表在不同的数据库中移动。
4.  空间可以回收(除drop table操作处,表空不能自已回收)
a)         drop table操作自动回收表空间,如果对于统计分析或是日值表,删除大量数据后可以通过:alter table tablename engine=innodb;回缩不用的空间。
b)         对于使innodb-plugin的innodb使用truncate table也会使空间收缩。
c)         对于使用独立表空间的表,不管怎么删除,表空间的碎片不会太严重的影响性能,而且还有机会处理。
缺点:
单表增加过大,如超过100个g。

对于启用了innodb_file_per_table 的参数选项之后,在每个表对应的.idb文件内只是存放了数据、索引和插入缓冲,而撤销(undo)信息,系统事务信息,二次写缓冲等还是存放在了原来的共享表空间内。

数据段即b+树的叶节点,索引段即为b+树的非索引节点。

innodb存储引擎的管理是由引擎本身完成的,表空间是由分散的页和段组成。

区由64个连续的页组成,每个页大小为16k,即每个区大小为1mb,创建新表时,先有32页大小的碎片页存放数据,使用完后才是区的申请,(innodb最多每次申请4个区,保证数据的顺序性能)

页类型有:数据页、undo页、系统页、事务数据页、插入缓冲位图页、以及插入缓冲空闲列表页。