MySQL的InnoDB引擎入门学习教程
mysql发展到今天,innodb引擎已经作为绝对的主力,除了像大数据量分析等比较特殊领域需求外,它适用于众多场景。然而,仍有不少开发者还在“执迷不悟”的使用myisam引擎,觉得对innodb无法把握好,还是myisam简单省事,还能支持快速count(*)。本文是由于最近几天帮忙处理discuz论坛有感而发,希望能对广大开发者有帮助。
1. 快速认识innodb
innodb是mysql下使用最广泛的引擎,它是基于mysql的高可扩展性和高性能存储引擎,从5.5版本开始,它已经成为了默认引擎。
innodb引擎支持众多特性:
a) 支持acid,简单地说就是支持事务完整性、一致性;
b) 支持行锁,以及类似oracle的一致性读,多用户并发;
c) 独有的聚集索引主键设计方式,可大幅提升并发读写性能;
d) 支持外键;
e) 支持崩溃数据自修复;
innodb有这么多特性,比myisam来的优秀多了,还犹豫什么,果断的切换到innodb引擎吧 :)
2. 修改innodb配置选项
可以选择官方版本,或者percona的分支,如果不知道在哪下载,就google吧。
安装完mysql后,需要适当修改下my.cnf配置文件,针对innodb相关的选项做一些调整,才能较好的运行innodb。
相关的选项有:
#innodb存储数据字典、内部数据结构的缓冲池,16mb 已经足够大了。 innodb_additional_mem_pool_size = 16m #innodb用于缓存数据、索引、锁、插入缓冲、数据字典等 #如果是专用的db服务器,且以innodb引擎为主的场景,通常可设置物理内存的50% #如果是非专用db服务器,可以先尝试设置成内存的1/4,如果有问题再调整 #默认值是8m,非常坑x,这也是导致很多人觉得innodb不如myisam好用的缘故 innodb_buffer_pool_size = 4g #innodb共享表空间初始化大小,默认是 10mb,也非常坑x,改成 1gb,并且自动扩展 innodb_data_file_path = ibdata1:1g:autoextend #如果不了解本选项,建议设置为1,能较好保护数据可靠性,对性能有一定影响,但可控 innodb_flush_log_at_trx_commit = 1 #innodb的log buffer,通常设置为 64mb 就足够了 innodb_log_buffer_size = 64m #innodb redo log大小,通常设置256mb 就足够了 innodb_log_file_size = 256m #innodb redo log文件组,通常设置为 2 就足够了 innodb_log_files_in_group = 2 #启用innodb的独立表空间模式,便于管理 innodb_file_per_table = 1 #启用innodb的status file,便于管理员查看以及监控等 innodb_status_file = 1 #设置事务隔离级别为 read-commited,提高事务效率,通常都满足事务一致性要求 transaction_isolation = read-committed 在这里,其他配置选项也需要注意: #设置最大并发连接数,如果前端程序是php,可适当加大,但不可过大 #如果前端程序采用连接池,可适当调小,避免连接数过大 max_connections = 60 #最大连接错误次数,可适当加大,防止频繁连接错误后,前端host被mysql拒绝掉 max_connect_errors = 100000 #设置慢查询阀值,建议设置最小的 1 秒 long_query_time = 1 #设置临时表最大值,这是每次连接都会分配,不宜设置过大 max_heap_table_size 和 tmp_table_size 要设置一样大 max_heap_table_size = 96m tmp_table_size = 96m #每个连接都会分配的一些排序、连接等缓冲,一般设置为 2mb 就足够了 sort_buffer_size = 2m join_buffer_size = 2m read_buffer_size = 2m read_rnd_buffer_size = 2m #建议关闭query cache,有些时候对性能反而是一种损害 query_cache_size = 0 #如果是以innodb引擎为主的db,专用于myisam引擎的 key_buffer_size 可以设置较小,8mb 已足够 #如果是以myisam引擎为主,可设置较大,但不能超过4g #在这里,强烈建议不使用myisam引擎,默认都是用innodb引擎 key_buffer_size = 8m #设置连接超时阀值,如果前端程序采用短连接,建议缩短这2个值 #如果前端程序采用长连接,可直接注释掉这两个选项,是用默认配置(8小时) interactive_timeout = 120 wait_timeout = 120
3. 开始使用innodb引擎
修改完配置文件,即可启动mysql。启动完毕后,在mysql的datadir目录下,若产生以下几个文件,则表示应该可以使用innodb引擎了。
-rw-rw---- 1 mysql mysql 1.0g sep 21 17:25 ibdata1 -rw-rw---- 1 mysql mysql 256m sep 21 17:25 ib_logfile0 -rw-rw---- 1 mysql mysql 256m sep 21 10:50 ib_logfile1
登录mysql后,执行命令,确认已启用innodb引擎:
(root:imysql.cn:thu oct 15 09:16:22 2009)[mysql]> show engines; +------------+---------+----------------------------------------------------------------+--------------+------+------------+ | engine | support | comment | transactions | xa | savepoints | +------------+---------+----------------------------------------------------------------+--------------+------+------------+ | innodb | yes | supports transactions, row-level locking, and foreign keys | yes | yes | yes |
接下来创建一个innodb表:
(root:imysql.cn:thu oct 15 09:16:22 2009)[mysql]> create table my_innodb_talbe( id int unsigned not null auto_increment, name varchar(20) not null default '', passwd varchar(32) not null default '', primary key(id), unique key `idx_name`(name) ) engine = innodb;
有几个和mysql(尤其是innodb引擎)数据表设计相关的建议,希望开发者朋友能遵循:
a) 所有innodb数据表都创建一个和业务无关的自增数字型作为主键,对保证性能很有帮助;
b) 杜绝使用text/blob,确实需要使用的,尽可能拆分出去成一个独立的表;
c) 时间戳建议使用 timestamp 类型存储;
d) ipv4 地址建议用 int unsigned 类型存储;
e) 性别等非是即非的逻辑,建议采用 tinyint 存储,而不是 char(1);
f) 存储较长文本内容时,建议采用json/bson格式存储;
4.了解innodb的存储结构
从物理意义上来讲,innodb表由共享表空间、日志文件组(redo文件组)、表结构定义文件组成。若将innodb_file_per_table设置为on,则系统将为每一个表单独的生成一个table_name.ibd的文件,在此文件中,存储与该表相关的数据、索引、表的内部数据字典信息。表结构文件则以.frm结尾,这与存储引擎无关。
以下为innodb的表空间结构图:
在innodb存储引擎中,默认表空间文件是ibdata1,初始化为10m,且可以扩展,如下图所示:
实际上,innodb的表空间文件是可以修改的,使用以下语句就可以修改:
innodb_data_file_path=ibdata1:370m;ibdata2:50m:autoextend
使用共享表空间存储方式时,innodb的所有数据保存在一个单独的表空间里面,而这个表空间可以由很多个文件组成,一个表可以跨多个文件存在,所以其大小限制不再是文件大小的限制,而是其自身的限制。从innodb的官方文档中可以看到,其表空间的最大限制为64tb,也就是说,innodb的单表限制基本上也在64tb左右了,当然这个大小是包括这个表的所有索引等其他相关数据。
而在使用单独表空间存储方式时,每个表的数据以一个单独的文件来存放,这个时候的单表限制,又变成文件系统的大小限制了。
以下即为不同平台下,单独表空间文件最大限度。
operating system file-size limit
win32 w/ fat/fat32 2gb/4gb
win32 w/ ntfs 2tb (possibly larger)
linux 2.4+ (using ext3 file system) 4tb
solaris 9/10 16tb
macos x w/ hfs+ 2tb
netware w/nss file system 8tb
以下是mysql文档中的内容:
windows用户请注意: fat和vfat (fat32)不适合mysql的生产使用。应使用ntfs。
共享表空间与独占表空间可以通过参数innodb_file_per_table来转换,若为1,则开启独占表空间,否则,开启共享表存储。
在服务器资源有限,单表数据不是特别多的情况下, 独立表空间明显比共享方式效率更高 . 但是mysql 默认是共享表空间 。
具体的共享表空间和独立表空间优缺点如下:
共享表空间:
优点:
可以放表空间分成多个文件存放到各个磁盘上(表空间文件大小不受表大小的限制,如一个表可以分布在不同步的文件上)。数据和文件放在一起方便管理。
缺点:
所有的数据和索引存放到一个文件中以为着将有一个很常大的文件,虽然可以把一个大文件分成多个小文件,但是多个表及索引在表空间中混合存储,这样对于一个表做了大量删除操作后表空间中将会有大量的空隙,特别是对于统计分析,日值系统这类应用最不适合用共享表空间。
独立表空间:在配置文件(my.cnf)中设置: innodb_file_per_table
优点:
1. 每个表都有自已独立的表空间。
2. 每个表的数据和索引都会存在自已的表空间中。
3. 可以实现单表在不同的数据库中移动。
4. 空间可以回收(除drop table操作处,表空不能自已回收)
a) drop table操作自动回收表空间,如果对于统计分析或是日值表,删除大量数据后可以通过:alter table tablename engine=innodb;回缩不用的空间。
b) 对于使innodb-plugin的innodb使用truncate table也会使空间收缩。
c) 对于使用独立表空间的表,不管怎么删除,表空间的碎片不会太严重的影响性能,而且还有机会处理。
缺点:
单表增加过大,如超过100个g。
对于启用了innodb_file_per_table 的参数选项之后,在每个表对应的.idb文件内只是存放了数据、索引和插入缓冲,而撤销(undo)信息,系统事务信息,二次写缓冲等还是存放在了原来的共享表空间内。
数据段即b+树的叶节点,索引段即为b+树的非索引节点。
innodb存储引擎的管理是由引擎本身完成的,表空间是由分散的页和段组成。
区由64个连续的页组成,每个页大小为16k,即每个区大小为1mb,创建新表时,先有32页大小的碎片页存放数据,使用完后才是区的申请,(innodb最多每次申请4个区,保证数据的顺序性能)
页类型有:数据页、undo页、系统页、事务数据页、插入缓冲位图页、以及插入缓冲空闲列表页。