MySQL 数据库优化有哪些方式？

程序员文章站 2022-05-24 11:54:20

...

MySQL 数据库优化有哪些方式？

回复内容：

MySQL 数据库优化有哪些方式？

写在前面的话：总是在灾难发生后，才想起容灾的重要性

其实数据库优化有很多种方式，不过只有在具体的场景中才会发挥它的最大价值，这是我对前人的优化做的一些总结，希望对你有帮助，以下优化针对mysql

设计原则

1、不在数据库做运算：cpu计算务必移至业务层
2、控制单表数据量：单表记录控制在1000w
3、控制列数量：字段数控制在20以内
4、平衡范式与冗余：为提高效率牺牲范式设计，冗余数据
5、拒绝3B：拒绝大sql，大事务，大批量
6、表字符集使用UTF8
7、使用INNODB存储引擎

数据表设计

1、尽可能地使用最有效(最小)的数据类型

tinyint(1Byte)
smallint(2Byte)
mediumint(3Byte)
int(4Byte)
bigint(8Byte)
bad case：int(1)/int(11)

2、不要将数字存储为字符串，字符转化为数字，用int存储ip而非char(15)
3、优先使用enum或set，sex enum (‘F’, ‘M’)
4，避免使用NULL字段

NULL字段很难查询优化
NULL字段的索引需要额外空间
NULL字段的复合索引无效
bad case：`name` char(32) default null`age` int not null
good case：`age` int not null default 0

5，少用text/blob，varchar的性能会比text高很多；实在避免不了blob，请拆表

6、不在数据库里存图片

7、对于MyISAM表，如果没有任何变长列(VARCHAR、TEXT或BLOB列)，使用固定尺寸的记录格式。这比较快但是不幸地可能会浪费一些空间。即使你已经用CREATE选项让VARCHAR列ROW_FORMAT=fixed，也可以提示想使用固定长度的行

8、使用sample character set，例如latin1。尽量少使用utf-8，因为utf-8占用的空间是latin1的3倍。可以在不需要使用utf-8的字段上面使用latin1，例如mail，url等

9、精确度与空间的转换。在存储相同数值范围的数据时，浮点数类型通常都会比DECIMAL类型使用更少的空间。FLOAT字段使用4 字节存储数据。DOUBLE类型需要8 个字节并拥有更高的精确度和更大的数值范围，DECIMAL类型的数据将会转换成DOUBLE类型

10、库名表名字段名必须有固定的命名长度，12个字符以内；库名、表名、字段名禁⽌止超过32个字符。须见名之意；库名、表名、字段名禁⽌止使⽤用MySQL保留字；临时库、表名必须以tmp为前缀，并以⽇日期为后缀；备份库、表必须以bak为前缀，并以日期为后缀

11、InnoDB表行记录物理长度不超过8KB，InnoDB的data page默认是16KB，基于B+Tree的特点，一个data page中需要至少存储2条记录。因此，当实际存储长度超过8KB（尤其是TEXT/BLOB列）的大列（large column）时会引起“page-overflow存储”，类似ORACLE中的“行迁移”，因此，如果必须使用大列（尤其是TEXT/BLOB类型）且读写频繁的话，则最好把这些列拆分到子表中，不要和主表放在一起存储，如果不太频繁，可以考虑继续保留在主表中，如果将 innodbpagesize 选项修改成 8KB，那么行记录物理长度建议不超过4KB

索引类

1、谨慎合理使用索引

改善查询、减慢更新
索引一定不是越多越好（能不加就不加，要加的一定得加）
覆盖记录条数过多不适合建索引，例如“性别”

2、字符字段必须建前缀索引

3、不在索引做列运算，bad case：select id where age +1 = 10;

4、innodb主键推荐使用自增列

主键建立聚簇索引
主键不应该被修改
字符串不应该做主键
如果不指定主键，innodb会使用唯一且非空值索引代替

5、不用外键，请由程序保证约束

6、避免在已有索引的前缀上建立索引。例如：如果存在index（a，b）则去掉index（a）

7、控制单个索引的长度。使用key（name（8））在数据的前面几个字符建立索引

8、要选择性的使用索引。在变化很少的列上使用索引并不是很好，例如性别列

9、Optimize table可以压缩和排序index，注意不要频繁运行

10、Analyze table可以更新数据

11、索引选择性是不重复的索引值也叫基数（cardinality）表中数据行数的比值，索引选择性=基数/数据行，count(distinct(username))/count(*) 就是索引选择性，高索引选择性的好处就是mysql查找匹配的时候可以过滤更多的行，唯一索引的选择性最佳，值为1

12、不要用重复或多余索引，对于INNODB引擎的索引来说，每次修改数据都要把主键索引，辅助索引中相应索引值修改，这可能会出现大量数据迁移，分页，以及碎片的出现

13、超过20个长度的字符串列，最好创建前缀索引而非整列索引（例如：ALTER TABLE t1 ADD INDEX(user(20))），可以有效提高索引利用率，不过它的缺点是对这个列排序时用不到前缀索引。前缀索引的长度可以基于对该字段的统计得出，一般略大于平均长度一点就可以了

14、定期用 pt-duplicate-key-checker 工具检查并删除重复的索引。比如 index idx1(a, b) 索引已经涵盖了 index idx2(a)，就可以删除 idx2 索引了

sql语句设计类

1、sql语句尽可能简单,一条sql只能在一个cpu运算，大语句拆小语句，减少锁时间，一条大sql可以堵死整个库(充分利用QUERY CACHE和充分利用多核CPU)

2、简单的事务,事务时间尽可能短,bad case：上传图片事务

3、避免使用trig/func,触发器、函数不用,客户端程序取而代之

4、不用select *,消耗cpu，io，内存，带宽,这种程序不具有扩展性

5、OR改写为IN()

or的效率是n级别
in的消息时log(n)级别
in的个数建议控制在200以内
select id from t where phone=’159′ or phone=’136′ =>select id from t where phone in (’159′, ’136′);

6、OR改写为UNION

mysql的索引合并很弱智
select id from t where phone = '159' or name = 'john';
=>
select id from t where phone='159' union  select id from t where name='jonh';

7、避免负向%，如not in/like

8、慎用count(*)

9、limit高效分页

limit越大，效率越低
select id from t limit 10000, 10;
=>
select id from t where id > 10000 limit 10;

10、使用union all替代union，union有去重开销

11、少用连接join

12、使用group by，分组、自动排序

13、请使用同类型比较

14、使用load data导数据，load data比insert快约20倍

15、对数据的更新要打散后批量更新，不要一次更新太多数据

16、使用性能分析工具

Sql explain  /  showprofile   /    mysqlsla

17、使用--log-slow-queries –long-query-time=2查看查询比较慢的语句。然后使用explain分析查询，做出优化

show profile;
mysqlsla;
mysqldumpslow;
explain;
show slow log;
show processlist;
show query_response_time(percona)

optimize 数据在插入，更新，删除的时候难免一些数据迁移，分页，之后就出现一些碎片，久而久之碎片积累起来影响性能，这就需要DBA定期的优化数据库减少碎片，这就通过optimize命令。如对MyISAM表操作：optimize table 表名

18、禁止在数据库中跑大查询

19、使⽤预编译语句，只传参数，比传递SQL语句更高效；一次解析，多次使用；降低SQL注入概率

20、禁止使⽤order by rand()

21、禁⽌单条SQL语句同时更新多个表

22、避免在数据库中进⾏数学运算(MySQL不擅长数学运算和逻辑判断)

23、SQL语句要求所有研发，SQL关键字全部是大写，每个词只允许有一个空格

24、能不用NOT IN就不用NOTIN，坑太多了。。会把空和NULL给查出来

留一个思考题吧，性能状态关键指标该怎么计算？

QPS，Queries Per Second：每秒查询数，一台数据库每秒能够处理的查询次数
TPS，Transactions Per Second：每秒处理事务数

注意
1、哪怕是基于索引的条件过滤，如果优化器意识到总共需要扫描的数据量超过30%时（ORACLE里貌似是20%，MySQL目前是30%，没准以后会调整），就会直接改变执行计划为全表扫描，不再使用索引

2、多表JOIN时，要把过滤性最大（不一定是数据量最小哦，而是只加了WHERE条件后过滤性最大的那个）的表选为驱动表。此外，如果JOIN之后有排序，排序字段一定要属于驱动表，才能利用驱动表上的索引完成排序

3、绝大多数情况下，排序的代价通常要来的更高，因此如果看到执行计划中有 Using filesort，优先创建排序索引吧

4、利用 pt-query-digest 定期分析slow query log，并结合 Box Anemometer 构建slow query log分析及优化系统

优化大致可以分为以下方面，按照执行难易程度和对当前项目影响排序：
1. MySQL参数优化：可以通过show variables;命令和show status;命令组合来综合分析，可调整的项目根据使用的存储引擎和项目瓶颈具体情况千差万别，需要具体问题具体分析，如果想从这方面入手，建议把问题提得更具体一点；
2. SQL查询优化和索引优化：你可以打开慢日志记录，将需要消耗太多时间的查询记录下来，然后分析相应的SQL语句是否写的不合理，不合理就改了；再到数据库中查表结构，看是否索引设置不合理（一般where语句中的常用字段和排序字段应该加上合适的索引）；
3. 增加缓存层：可考虑在MySQL与应用层中间加一个缓存层，如APC、Memcached、Redis等等，将经常使用而更新较少的数据放到缓存层中，可以很好的减轻数据库压力；
4. 优化表结构：首先这个代价稍大，可能要重新灌数据之类的，代码修改可能也会比较多，看之前的封装性好不好了。主要是根据业务需要，看是否之前的表结构有不合理的地方，比如你使用了很多但是又无法排除的join查询；
5. 分库、分表、主从分离：分库是把数据库从1个逻辑库拆分到多个逻辑库，或从1个服务器拆分到多个服务器，分表是将一个表拆分为多个表，甚至是多个物理服务器的不同表；主从分离是将读、写完全分离到不同的数据库服务器；这个方案跟4一样，也是代价比较大，但是可持续性很好，项目到达一定的数量级，必须走这一步；
6. 自己定制MySQL：开源的，可以根据自己特殊业务需要定制，太高端了点点，总之有这种可能，没搞过...

1.不要 select * 按需查询 2.重构查询，根据需要控制索引的使用。因为MySql在一个where子句中只能匹配一条索引（一般来说就是第一个条件），所以在查询中要尽量的缩小条件的范围,尽量使用 = 而不是> \

一本书都写不完，别寄希望让别人直接告诉你答案，找本书好好读几遍。

高性能MySQL 中文第3版

这本书有很多地方都是讲优化的，楼主可以去看看，电子版的也有，我就不给链接了：）

最基础的也是最常用的 explain

太多了。我就给你说影响速度最大的几个原因吧。 1.数据库选用 2.数据库的设计 3.sql语句的拼写细说2和3.首先设计肯定很重要，这个不能教你。你自己多问那些行家。一般情况下，不属于同一个范畴的东西不要放在一张表中，除非他们经常同时被查询，而且多的一方的数量很少，比如3个以内。如果说是一个多的时候，多的一方个数比较多，那么，肯定不能融合成一张表。其次，索引什么的必须的吧，还有就是范围的优先缩小，比如说where后面把结果集小的放前面，大的放后面，就好比说你从100个人，80个男的，20个女的，其中有60个人都比较高。叫你找10个比较高的女人。你说你是去女的中找10个高的，还是去所有人中先找高的，然后再从里面选10个女的。如果是大数据，除开索引外，那么分库，分表肯定就是很必要的。多看书，多看博客，这种问题没人帮得了你，太多了，在实际项目中再学吧。

MySQL 数据库优化有哪些方式？

回复内容：

手机APP软件怎样推广,APP的推广方式有哪些?

网站推广的方式有哪些，网站常用的推广方法介绍

Mysql数据库性能优化之子查询

mysql数据库优化必会的几个参数中文解释

安卓APP开发优势及推广方式有哪些

企业网站有哪些优化推广方法

MySQL中有哪些情况下数据库索引会失效详析

详解Ubuntu Server下启动/停止/重启MySQL数据库的三种方式

关键词优化有哪些实用的方法

企业推广方式有哪些？该如何选择