MariaDB 新版本实力逆袭不仅仅是 MySQL 替代品
mysql分支——mariadb
mariadb是mysql源代码的一个分支,主要由开源社区在维护,采用gpl授权许可。开发这个分支的原因之一是:甲骨文公司收购了mysql后,有将mysql闭源的潜在风险,因此社区采用分支的方式来避开这个风险。mariadb是完全兼容mysql,包括api和命令行,使之能轻松成为mysql的代替品。在存储引擎方面,使用xtradb来代替mysql的innodb,xtradb完全兼容innodb,创建一个innodb表内部默认会转换成xtradb。
percona xtradb 是 innodb 存储引擎的增强版,用来更好地发挥最新的计算机硬件系统性能,同时还包含一些在高性能环境下的新特性。xtradb 存储引擎是完全的向下兼容,在 mariadb 中,xtradb 存储引擎被标识为"engine=innodb",这与 innodb 是一样的,所以可以直接用xtradb 替换掉 innodb,而不会产生任何问题。xtradb 在 innodb 的基础上构建,使 xtradb 具有更多的特性,更多的参数指标和更多的扩展。从实践的角度来看,xtradb 在cpu多核的条件下更有效的使用内存,并且性能更高。从 mariadb 5.1 开始就默认使用 xtradb 存储引擎。
mariadb由mysql的创始人michael (monty) widenius主导开发,他早前曾以10亿美元的价格,将自己创建的公司mysql ab卖给了sun,此后,随着sun被甲骨文收购,mysql的所有权也落入oracle的手中。mariadb名称来自michael (monty) widenius的女儿maria的名字。
一、mariadb 10.0和mysql 5.6的不同之处
mysql 5.6 的代码库的文件结构已经被改动了。比如单个代码文件已经被分成多个,又或者是某些代码已经被重新归类到了不同的文件内。所以要把mariadb 去配合现在这个文件结构一定是一个非常消耗时间的过程。
mairadb 5.5 已经有大量的代码不同于mysql 5.5 的版本,而且也有很多的新的特征被整合到mariadb 5.5 中,而这些特征直到 5.6 版本才出现在mysql中。所以在比较同样功能的mysql和mariadb的版本,同时在完成设计和qa方面的审核后,一个很明显的结论是mariadb会是一个更好的产品。在大多数情况下,在选择 mariadb的时候,人们会更多地考虑到功能方面的偏好。
mariadb不仅仅是mysql的一个替代品。它的主要目的是创新和提高mysql的技术,mysql5.6不是一个合适的创新基础平台,所以mariadb团队就做了下面的事情:
引入了一些新功能(像multi-source replication多源复制,基于表的并行复制,galera cluster集群,spider水平分片存储引擎,tokudb存储引擎等),所以需要搞个新版本。
下个版本称作“mariadb5.6”是不准确的,因为它不是基于mysql5.6的,取而代之,mariadb团队决定版本号调为10.0。
mariadb和percona有什么不同呢?
percona是仅仅针对innodb引擎上做了性能上的改善(称为xtradb),而mariadb在集成了xtradb存储引擎之外,还集成了更多的存储引擎,包括aria、sphinxse、tokudb、cassandra、connect、sequence及spider存储引擎等,并且在服务器层上做了大量改进,增加了多源复制和基于表的并行复制等。
二、mariadb和mysql的兼容性
mariadb跟mysql在绝大多数方面是兼容的,对于前端应用(比如php、perl、python、java、.net、myodbc、ruby、mysql c connector)来说,几乎感觉不到任何不同。目前mariadb是发展最快的mysql分支版本,新版本的发布速度已经超过了oracle官方的mysql版本。
注:mariadb10.0/10.1的gtid复制跟mysql5.6不兼容。
在oracle控制下的mysql开发,有两个主要问题:
mysql核心开发团队是封闭的,完全没有oracle之外的成员参加。很多高手即使有心做贡献,也没办法做到。
mysql新版本的发布速度,在oracle收购sun之后大为减缓。
michael (monty) widenius有一个ppt,用数据比较了收购之前和之后新版本的发布速度,并表示有很多bugfix和新的feature,都没有及时加入到发布版本之中。
以上这两个问题,导致了各个大公司,都开发了自己定制的mysql版本,包括yahoo!、facebook、google、阿里巴巴和淘宝网等。mysql是开源社区的资产,任何个人/组织都无权据为己有。为了更快速地发展mysql,另外开分支是必须的。
三、mariadb 10.0新增的功能
更多的存储引擎
除了包含标准的myisam、blackhole、csv、memory、archive和merge等存储引擎外,mariadb的源代码包和二进制包还包含以下额外的存储引擎:
aria(增强版的myisam)
xtradb(增强版的innodb)
federatedx
oqgraph
sphinxse[1]
ibmdb2i
tokudb[2]
cassandra
connect
sequence
spider[3]
pbxt
速度提升
在mariadb5.3版本里,就已经对子查询进行了优化,并采用semi join半连接方式将sql改写为了表关联join,从而提高了查询速度。
在mariadb5.3版本里,引入了group commit for the binary log组提交技术,简单的说,多个并发提交的事务加入一个队列里,对这个队列里的事务,利用一次i/o合并提交,从而解决了写日志频繁刷磁盘的问题。
在mariadb10.0版本里,引入了基于表的多线程并行复制技术,如果主库上1秒内有10个事务,那么合并一个i/o提交一次,并在binlog里增加一个cid = xx 标记,当cid的值是一样时,slave就可以进行并行复制,通过设置多个sql_thread线程实现。在mysql5.5版本里是单进程串行复制,通过sql_thread线程来恢复主库推送过来的binlog,这样会产生一个问题,主库上大量的写操作,从库就有可能会出现延迟。在mysql5.6是基于库级别的并行复制,mysql5.7是基于表级别的并行复制。
在mariadb5.5版本里,引入了线程池thread pool技术,线程池的连接复用,减少了建立连接的开销,减少了cpu上下文切换,非常适合高并发php短连接应用场景(例如使用开源电商平台ecshop秒杀业务场景)。
在处理内部的临时表,mariadb用aria引擎代替了myisam引擎,这将使某些group by和distinct请求速度更快,因为aria有比myisam更好的缓存机制。
扩展和新功能
时间精确到微秒级别
提供了虚拟列(函数索引)
在mariadb5.2版本里,就已经提供了虚拟列(函数索引),但直到mysql5.7版本才支持。
kill命令扩展
在mariadb5.3版本里,又对kill命令进行了扩展,可以指定某个user用户,杀死所有查询
修改表结构可显示执行进度
提供了动态列(可以存储json格式)
在mariadb5.3版本里,就已经提供了动态列(可以存储json格式),但直到mysql5.7版本才支持。
提供了多源复制,但直到mysql5.7版本才支持。
支持gtid同步复制。
创建了用户支持创建角色role权限。
通过show processlist可以查看内存占用。
执行create or replace table 等于先执行drop操作,再执行create操作。
执行delete from table returning命令可删除前返回删除的记录。
慢查询日志slow log里增加了explain执行计划。
四、总结
mariadb是甲骨文mysql的加强版本,因此已有的系统不需要任何修改就可以运行,就像使用percona server一样。
mariadb社区版和企业版的源代码都是开源的,并且所有功能都是免费开放,不用担心功能上有阉割,但甲骨文mysql企业版延伸套件采取封闭源代码且需要付费。此外,mariadb相比mysql拥有更多的功能、更快、更稳定、bug修复更快。