10个MySQL性能调优的方法
mysql 应该是最流行了 web 后端数据库。web 开发语言最近发展很快,php, ruby, python, java 各有特点,虽然 nosql 最近越來越多的被提到,但是相信大部分架构师还是会选择 mysql 来做数据存储。
mysql 如此方便和稳定,以至于我们在开发 web 程序的时候很少想到它。即使想到优化也是程序级别的,比如,不要写过于消耗资源的 sql 语句。但是除此之外,在整个系统上仍然有很多可以优化的地方。
1. 选择合适的存储引擎: innodb
除非你的数据表使用来做只读或者全文检索 (相信现在提到全文检索,没人会用 mysql 了),你应该默认选择 innodb 。
你自己在测试的时候可能会发现 myisam 比 innodb 速度快,这是因为: myisam 只缓存索引,而 innodb 缓存数据和索引,myisam 不支持事务。但是 如果你使用 innodb_flush_log_at_trx_commit = 2 可以获得接近的读取性能 (相差百倍) 。
1.1 如何将现有的 myisam 数据库转换为 innodb:
perl -p -i -e 's/(search_[a-z_]+ engine=)innodb//1myisam/g' alter_table.sql
mysql -u [user_name] -p [database_name] < alter_table.sql
1.2 为每个表分别创建 innodb file:
这样可以保证 ibdata1 文件不会过大,失去控制。尤其是在执行 mysqlcheck -o –all-databases 的时候。
2. 保证从内存中读取数据,讲数据保存在内存中
2.1 足够大的 innodb_buffer_pool_size
推荐将数据完全保存在 innodb_buffer_pool_size ,即按存储量规划 innodb_buffer_pool_size 的容量。这样你可以完全从内存中读取数据,最大限度减少磁盘操作。
2.1.1 如何确定 innodb_buffer_pool_size 足够大,数据是从内存读取而不是硬盘?
方法 1
mysql> show global status like 'innodb_buffer_pool_pages_%'; +----------------------------------+--------+ | variable_name | value | +----------------------------------+--------+ | innodb_buffer_pool_pages_data | 129037 | | innodb_buffer_pool_pages_dirty | 362 | | innodb_buffer_pool_pages_flushed | 9998 | | innodb_buffer_pool_pages_free | 0 | !!!!!!!! | innodb_buffer_pool_pages_misc | 2035 | | innodb_buffer_pool_pages_total | 131072 | +----------------------------------+--------+ 6 rows in set (0.00 sec)
发现 innodb_buffer_pool_pages_free 为 0,则说明 buffer pool 已经被用光,需要增大 innodb_buffer_pool_size
innodb 的其他几个参数:
innodb_max_dirty_pages_pct 80%
方法 2
或者用iostat -d -x -k 1 命令,查看硬盘的操作。
2.1.2 服务器上是否有足够内存用来规划
执行 echo 1 > /proc/sys/vm/drop_caches 清除操作系统的文件缓存,可以看到真正的内存使用量。
2.2 数据预热
默认情况,只有某条数据被读取一次,才会缓存在 innodb_buffer_pool。所以,数据库刚刚启动,需要进行数据预热,将磁盘上的所有数据缓存到内存中。数据预热可以提高读取速度。
对于 innodb 数据库,可以用以下方法,进行数据预热:
1. 将以下脚本保存为 makeselectqueriestoload.sql
select distinct concat('select ',ndxcollist,' from ',db,'.',tb, ' order by ',ndxcollist,';') selectquerytoloadcache from ( select engine,table_schema db,table_name tb, index_name,group_concat(column_name order by seq_in_index) ndxcollist from ( select b.engine,a.table_schema,a.table_name, a.index_name,a.column_name,a.seq_in_index from information_schema.statistics a inner join ( select engine,table_schema,table_name from information_schema.tables where engine='innodb' ) b using (table_schema,table_name) where b.table_schema not in ('information_schema','mysql') order by table_schema,table_name,index_name,seq_in_index ) a group by table_schema,table_name,index_name ) aa order by db,tb ;
2. 执行
3. 每次重启数据库,或者整库备份前需要预热的时候执行:
mysql -uroot < /root/selectqueriestoload.sql > /dev/null 2>&1
2.3 不要让数据存到 swap 中
如果是专用 mysql 服务器,可以禁用 swap,如果是共享服务器,确定 innodb_buffer_pool_size 足够大。或者使用固定的内存空间做缓存,使用 memlock 指令。
3. 定期优化重建数据库
mysqlcheck -o –all-databases 会让 ibdata1 不断增大,真正的优化只有重建数据表结构:
create table mydb.mytablenew like mydb.mytable; insert into mydb.mytablenew select * from mydb.mytable; alter table mydb.mytable rename mydb.mytablezap; alter table mydb.mytablenew rename mydb.mytable; drop table mydb.mytablezap;
4. 减少磁盘写入操作
4.1 使用足够大的写入缓存 innodb_log_file_size
但是需要注意如果用 1g 的 innodb_log_file_size ,假如服务器当机,需要 10 分钟来恢复。
推荐 innodb_log_file_size 设置为 0.25 * innodb_buffer_pool_size
4.2 innodb_flush_log_at_trx_commit
这个选项和写磁盘操作密切相关:
innodb_flush_log_at_trx_commit = 1 则每次修改写入磁盘
innodb_flush_log_at_trx_commit = 0/2 每秒写入磁盘
如果你的应用不涉及很高的安全性 (金融系统),或者基础架构足够安全,或者 事务都很小,都可以用 0 或者 2 来降低磁盘操作。
4.3 避免双写入缓冲
5. 提高磁盘读写速度
raid0 尤其是在使用 ec2 这种虚拟磁盘 (ebs) 的时候,使用软 raid0 非常重要。
6. 充分使用索引
6.1 查看现有表结构和索引
6.2 添加必要的索引
索引是提高查询速度的唯一方法,比如搜索引擎用的倒排索引是一样的原理。
索引的添加需要根据查询来确定,比如通过慢查询日志或者查询日志,或者通过 explain 命令分析查询。
add index
6.2.1 比如,优化用户验证表:
添加索引
alter table users add unique index username_password_ndx (username,password);
每次重启服务器进行数据预热
添加启动脚本到 my.cnf
init-file=/var/lib/mysql/upcache.sql
6.2.2 使用自动加索引的框架或者自动拆分表结构的框架
比如,rails 这样的框架,会自动添加索引,drupal 这样的框架会自动拆分表结构。会在你开发的初期指明正确的方向。所以,经验不太丰富的人一开始就追求从 0 开始构建,实际是不好的做法。
7. 分析查询日志和慢查询日志
记录所有查询,这在用 orm 系统或者生成查询语句的系统很有用。
注意不要在生产环境用,否则会占满你的磁盘空间。
记录执行时间超过 1 秒的查询:
log-slow-queries=/var/log/mysql/log-slow-queries.log
8. 激进的方法,使用内存磁盘
现在基础设施的可靠性已经非常高了,比如 ec2 几乎不用担心服务器硬件当机。而且内存实在是便宜,很容易买到几十g内存的服务器,可以用内存磁盘,定期备份到磁盘。
将 mysql 目录迁移到 4g 的内存磁盘
mkdir -p /mnt/ramdisk sudo mount -t tmpfs -o size=4000m tmpfs /mnt/ramdisk/ mv /var/lib/mysql /mnt/ramdisk/mysql ln -s /tmp/ramdisk/mysql /var/lib/mysql chown mysql:mysql mysql
9. 用 nosql 的方式使用 mysql
b-tree 仍然是最高效的索引之一,所有 mysql 仍然不会过时。
用 handlersocket 跳过 mysql 的 sql 解析层,mysql 就真正变成了 nosql。
10. 其他
单条查询最后增加 limit 1,停止全表扫描。
将非”索引”数据分离,比如将大篇文章分离存储,不影响其他自动查询。
不用 mysql 内置的函数,因为内置函数不会建立查询缓存。
php 的建立连接速度非常快,所有可以不用连接池,否则可能会造成超过连接数。当然不用连接池 php 程序也可能将
连接数占满比如用了 @ignore_user_abort(true);
使用 ip 而不是域名做数据库路径,避免 dns 解析问题
以上就是10个mysql性能调优的方法,希望对大家的学习有所帮助。