欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

MySQL数据库引擎介绍、区别、创建和性能测试的深入分析

程序员文章站 2024-02-23 19:39:34
数据库引擎介绍 mysql数据库引擎取决于mysql在安装的时候是如何被编译的。要添加一个新的引擎,就必须重新编译mysql。在缺省情况下,mysql支持三个引擎:isa...

数据库引擎介绍

mysql数据库引擎取决于mysql在安装的时候是如何被编译的。要添加一个新的引擎,就必须重新编译mysql。在缺省情况下,mysql支持三个引擎:isam、myisam和heap。另外两种类型innodb和berkley(bdb),也常常可以使用。如果技术高超,还可以使用mysql+api自己做一个引擎。下面介绍几种数据库引擎:

    isam:isam是一个定义明确且历经时间考验的数据表格管理方法,它在设计之时就考虑到 数据库被查询的次数要远大于更新的次数。因此,isam执行读取操作的速度很快,而且不占用大量的内存和存储资源。isam的两个主要不足之处在于,它不 支持事务处理,也不能够容错:如果你的硬盘崩溃了,那么数据文件就无法恢复了。如果你正在把isam用在关键任务应用程序里,那就必须经常备份你所有的实 时数据,通过其复制特性,mysql能够支持这样的备份应用程序。
    myisam:myisam是mysql的isam扩展格式和缺省的数据库引擎。除了提供isam里所没有的索引和字段管理的大量功能,myisam还使用一种表格锁定的机制,来优化多个并发的读写操作,其代价是你需要经常运行optimize table命令,来恢复被更新机制所浪费的空间。myisam还有一些有用的扩展,例如用来修复数据库文件的myisamchk工具和用来恢复浪费空间的 myisampack工具。myisam强调了快速读取操作,这可能就是为什么mysql受到了web开发如此青睐的主要原因:在web开发中你所进行的大量数据操作都是读取操作。所以,大多数虚拟主机提供商和internet平台提供商只允许使用myisam格式myisam格式的一个重要缺陷就是不能在表损坏后恢复数据。
    heapheap允许只驻留在内存里的临时表格。驻留在内存里让heap要比isam和myisam都快,但是它所管理的数据是不稳定的,而且如果在关机之前没有进行保存,那么所有的数据都会丢失。在数据行被删除的时候,heap也不会浪费大量的空间。heap表格在你需要使用select表达式来选择和操控数据的时候非常有用。要记住,在用完表格之后就删除表格
    innodb:innodb数据库引擎都是造就mysql灵活性的技术的直接产品,这项技术就是mysql+api。在使用mysql的时候,你所面对的每一个挑战几乎都源于isam和myisam数据库引擎不支持事务处理(transaction process)也不支持外来键。尽管要比isam和 myisam引擎慢很多,但是innodb包括了对事务处理和外来键的支持,这两点都是前两个引擎所没有的。如前所述,如果你的设计需要这些特性中的一者 或者两者,那你就要*使用后两个引擎中的一个了。
    如果感觉自己的确技术高超,你还能够使用mysql+api来创建自己的数据库引擎。这个api为你提供了操作字段、记录、表格、数据库、连接、安全帐号的功能,以及建立诸如mysql这样dbms所需要的所有其他无数功能。深入讲解api已经超出了本文的范围,但是你需要了解mysql+api的存在及其可交换引擎背后的技术,这一点是很重要的。估计这个插件式数据库引擎的模型甚至能够被用来为mysql创建本地的xml提供器(xml provider)。(任何读到本文的mysql+api开发人员可以把这一点当作是个要求。)
myisam与innodb的区别
  innodb和myisam是许多人在使用mysql时最常用的两个表类型,这两个表类型各有优劣,视具体应用而定。基本的差别为:myisam类型不支持事务处理等高级处理,而innodb类型支持。myisam类型的表强调的是性能,其执行数度比innodb类型更快,但是不提供事务支持,而innodb提供事务支持已经外部键等高级数据库功能。

以下是一些细节和具体实现的差别:
1.innodb不支持fulltext类型的索引。
2.innodb 中不保存表的具体行数,也就是说,执行select count(*) fromtable时,innodb要扫描一遍整个表来计算有多少行,但是myisam只要简单的读出保存好的行数即可。注意的是,当count(*)语句包含where条件时,两种表的操作是一样的。
3.对于auto_increment类型的字段,innodb中必须包含只有该字段的索引,但是在myisam表中,可以和其他字段一起建立联合索引。
4.delete from table时,innodb不会重新建立表,而是一行一行的删除。
5.load table frommaster操作对innodb是不起作用的,解决方法是首先把innodb表改成myisam表,导入数据后再改成innodb表,但是对于使用的额外的innodb特性(例如外键)的表不适用。

另外,innodb表的行锁也不是绝对的,假如在执行一个sql语句时mysql不能确定要扫描的范围,innodb表同样会锁全表,例如updatetable set num=1 where name like “a%”
两种类型最主要的差别就是innodb支持事务处理与外键和行级锁.而myisam不支持.所以myisam往往就容易被人认为只适合在小项目中使用。
我作为使用mysql的用户角度出发,innodb和myisam都是比较喜欢的,但是从我目前运维的数据库平台要达到需求:99.9%的稳定性,方便的扩展性和高可用性来说的话,myisam绝对是我的首选。

原因如下:
1、首先我目前平台上承载的大部分项目是读多写少的项目,而myisam的读性能是比innodb强不少的。
2、myisam的索引和数据是分开的,并且索引是有压缩的,内存使用率就对应提高了不少。能加载更多索引,而innodb是索引和数据是紧密捆绑的,没有使用压缩从而会造成innodb比myisam体积庞大不小。
3、从平台角度来说,经常隔1,2个月就会发生应用开发人员不小心update一个表where写的范围不对,导致这个表没法正常用了,这个时候myisam的优越性就体现出来了,随便从当天拷贝的压缩包取出对应表的文件,随便放到一个数据库目录下,然后dump成sql再导回到主库,并把对应的binlog补上。如果是innodb,恐怕不可能有这么快速度,别和我说让innodb定期用导出xxx.sql机制备份,因为我平台上最小的一个数据库实例的数据量基本都是几十g大小。
4、从我接触的应用逻辑来说,select count(*) 和order by是最频繁的,大概能占了整个sql总语句的60%以上的操作,而这种操作innodb其实也是会锁表的,很多人以为innodb是行级锁,那个只是where对它主键是有效,非主键的都会锁全表的。
5、还有就是经常有很多应用部门需要我给他们定期某些表的数据,myisam的话很方便,只要发给他们对应那表的frm.myd,myi的文件,让他们自己在对应版本的数据库启动就行,而innodb就需要导出xxx.sql了,因为光给别人文件,受字典数据文件的影响,对方是无法使用的。
6、如果和myisam比insert写操作的话,innodb还达不到myisam的写性能,如果是针对基于索引的update操作,虽然myisam可能会逊色innodb,但是那么高并发的写,从库能否追的上也是一个问题,还不如通过多实例分库分表架构来解决。
7、如果是用myisam的话,merge引擎可以大大加快应用部门的开发速度,他们只要对这个merge表做一些selectcount(*)操作,非常适合大项目总量约几亿的rows某一类型(如日志,调查统计)的业务表。
当然innodb也不是绝对不用,用事务的项目如模拟炒股项目,我就是用innodb的,活跃用户20多万时候,也是很轻松应付了,因此我个人也是很喜欢innodb的,只是如果从数据库平台应用出发,我还是会首myisam。
另外,可能有人会说你myisam无法抗太多写操作,但是我可以通过架构来弥补,说个我现有用的数据库平台容量:主从数据总量在几百t以上,每天十多亿pv的动态页面,还有几个大项目是通过数据接口方式调用未算进pv总数,(其中包括一个大项目因为初期memcached没部署,导致单台数据库每天处理9千万的查询)。而我的整体数据库服务器平均负载都在0.5-1左右。

一般来说,myisam适合:
(1)做很多count 的计算;
(2)插入不频繁,查询非常频繁;
(3)没有事务。

innodb适合:
(1)可靠性要求比较高,或者要求事务;
(2)表更新和查询都相当的频繁,并且表锁定的机会比较大的情况指定数据引擎的创建
让所有的灵活性成为可能的开关是提供给ansi sql的mysql扩展——type参数。mysql能够让你在表格这一层指定数据库引擎,所以它们有时候也指的是table formats。下面的示例代码表明了如何创建分别使用myisam、isam和heap引擎的表格。要注意,创建每个表格的代码是相同的,除了最后的 type参数,这一参数用来指定数据引擎。

以下为引用的内容:

复制代码 代码如下:

create table tblmyisam (
id int not null auto_increment,
primary key (id),
value_a tinyint
) type=myisam
create table tblisam (
id int not null auto_increment,
primary key (id),
value_a tinyint
) type=isam
create table tblheap (
id int not null auto_increment,
primary key (id),
value_a tinyint
) type=heap

你也可以使用alter table命令,把原有的表格从一个引擎移动到另一个引擎。下面的代码显示了如何使用alter table把myisam表格移动到innodb的引擎:

以下为引用的内容:

复制代码 代码如下:

alter table tblmyisam change type=innodb

mysql用三步来实现这一目的。首先,这个表格的一个副本被创建。然后,任何输入数据的改变都被排入队列,同时这个副本被移动到另一个引擎。最后,任何排入队列的数据改变都被送交到新的表格里,而原来的表格被删除。
复制代码 代码如下:

alter table捷径

如果只是想把表格从isam更新为myisam,你可以使用mysql_convert_table_format命令,而不需要编写alter table表达式。

你可以使用show table命令(这是mysql对ansi标准的另一个扩展)来确定哪个引擎在管理着特定的表格。show table会返回一个带有多数据列的结果集,你可以用这个结果集来查询获得所有类型的信息:数据库引擎的名称在type字段里。下面的示例代码说明了 show table的用法:

复制代码 代码如下:

show table status from tblinnodb

 你可以用show create table [tablename]来取回show table能够取回的信息。
一般情况下,mysql会默认提供多种存储引擎,可以通过下面的查看:
(1)看你的mysql现在已提供什么存储引擎: mysql> show engines;
(2)看你的mysql当前默认的存储引擎: mysql> show variables like '%storage_engine%';
(3)你要看某个表用了什么引擎(在显示结果里参数engine后面的就表示该表当前用的存储引擎): mysql> show create table 表名;
最后,如果你想使用没有被编译成mysql也没有被激活的引擎,那是没有用的,mysql不会提示这一点。而它只会给你提供一个缺省格式(myisam)的表格。除了使用缺省的表格格式外,还有办法让mysql给出错误提示,但是就现在而言,如果不能肯定特定的数据库引擎是否可用的话,你要使用show table来检查表格格式。
更多的选择意味着更好的性能
用于特定表格的引擎都需要重新编译和追踪,考虑到这种的额外复杂性,为什么你还是想要使用非缺省的数据库引擎呢?答案很简单:要调整数据库来满足你的要求。
可以肯定的是,myisam的确快,但是如果你的逻辑设计需要事务处理,你就可以*使用支持事务处理的引擎。进一步讲,由于mysql能够允许你在表格这一层应用数据库引擎,所以你可以只对需要事务处理的表格来进行性能优化,而把不需要事务处理的表格交给更加轻便的myisam引擎。对于 mysql而言,灵活性才是关键。

性能测试
所有的性能测试在:micrisoft window xp sp2 , intel(r) pentinum(r) m processor 1.6oghz 1g 内存的电脑上测试。
测试方法:连续提交10个query, 表记录总数:38万 , 时间单位 s
引擎类型myisaminnodb  性能相差
count 0.00083573.01633609
查询主键   0.005708  0.157427.57
查询非主键   24.01 80.37  3.348
更新主键   0.008124  0.8183100.7
更新非主键   0.004141  0.02625  6.338
插入   0.004188  0.369488.21
(1)加了索引以后,对于myisam查询可以加快:4 206.09733倍,对innodb查询加快510.72921倍,同时对myisam更新速度减慢为原来的1/2,innodb的更新速度减慢为原来的1/30。要看情况决定是否要加索引,比如不查询的log表,不要做任何的索引。
(2)如果你的数据量是百万级别的,并且没有任何的事务处理,那么用myisam是性能最好的选择。
(3)innodb表的大小更加的大,用myisam可省很多的硬盘空间。

在我们测试的这个38w的表中,表占用空间的情况如下:

引擎类型myisam   innodb
数据  53,924 kb   58,976 kb
索引 13,640 kb   21,072 kb

占用总空间 67,564 kb   80,048 kb

另外一个176w万记录的表, 表占用空间的情况如下:
引擎类型myisam   innordb
数据  56,166 kb   90,736 kb
索引  67,103 kb   88,848 kb

占用总空间  123,269 kb179,584 kb

其他
    mysql 官方对innodb是这样解释的innodb给mysql提供了具有提交、回滚和崩溃恢复能力的事务安全(acid兼容)存储引擎。innodb锁定在行级并且也在select语句提供一个oracle风格一致的非锁定读,这些特色增加了多用户部署和性能。没有在innodb中扩大锁定的需要,因为在innodb中行级锁定适合非常小的空间。innodb也支持foreign key强制。在sql查询中,你可以*地将innodb类型的表与其它mysql的表的类型混合起来,甚至在同一个查询中也可以混合。
    innodb是为处理巨大数据量时的最大性能设计,它的cpu效率可能是任何其它基于磁盘的关系数据库引擎所不能匹敌的。
    innodb存储引擎被完全与mysql服务器整合,innodb存储引擎为在主内存中缓存数据和索引而维持它自己的缓冲池。innodb存储它的表&索引在一个表空间中,表空间可以包含数个文件(或原始磁盘分区)。这与myisam表不同,比如在myisam表中每个表被存在分离的文件中。innodb 表可以是任何尺寸,即使在文件尺寸被限制为2gb的操作系统上。
    innodb默认地被包含在mysql二进制分发中。windows essentials installer使innodb成为windows上mysql的默认表。
    innodb被用来在众多需要高性能的大型数据库站点上产生。著名的internet新闻站点slashdot.org运行在innodb上。 mytrix, inc.在innodb上存储超过1tb的数据,还有一些其它站点在innodb上处理平均每秒800次插入/更新的.