MySQL相关参数总结

程序员文章站 2022-04-09 15:33:41

保留个原文链接，避免被爬虫爬了过去，以便后续更正补充：https://www.cnblogs.com/wy123/p/11273023.html MySQL参数繁多，是一个需要根据具体业务、软硬件环境、负载压力、性能需求、数据异常的容忍程度等等信息综合考量的结果，不是一成不变的（当然，某些参数保持默 ......

保留个原文链接，避免被爬虫爬了过去，以便后续更正补充：

mysql参数繁多，是一个需要根据具体业务、软硬件环境、负载压力、性能需求、数据异常的容忍程度等等信息综合考量的结果，不是一成不变的（当然，某些参数保持默认值就够了）。
想管好数据库，必须理解数据库的一些配置选项，以及其背景因素。
陆陆续续收集整理了好多mysql相关的参数，总是觉得串不起来，总结归类之后，立马就清晰了很多，提到一个参数，首先会往分门别类，类别是什么，作用是什么，有哪些相关的知识点，需要注意什么。
这里根据个人的思路，用xmind做了一个归类总结以及说明，后续会修正，补充、增加。

MySQL相关参数总结

对于这些参数的理解与说明，来自于网络、书籍以及自己的理解整理而成，不一定完全正确，随时补充、更正、纠错，这里参考了许多博客，并有大段的引用解释，详细情况会一一注明

general参数

server_id = xxx

in mysql 5.7, the --server-id option must be specified if binary logging is enabled, otherwise the server is not allowed to start.

mysql同步的数据中是包含server_id的，用于标识该语句最初是从哪个server写入的，因此server_id一定要有的，根据需求修改，不能重复

user = mysql

mysql使用的用户

datadir = /usr/local/mysql57/data

数据文件路径

tmpdir = /usr/local/mysql57/tmp

临时文件路径

character-set-server = utf8mb4

默认server字符集

collation-server = utf8mb4_general_ci

字符序，某种字符集下，也即character-set-server已知的情况下，存在多种排序规则，指定其中一种排序规则，其实叫做排序规则更容易理解。

port = 3306

数据库服务端口号

default_storage_engine =innodb

默认为innodb引擎

socket = /usr/local/mysql57/mysql.sock

本机连接至mysql服务可以使用sock方式连接，实际上是mysql服务的进程id

pid-file = /usr/local/mysql57/data/mysql.pid

mysql的进程文存放位置

log_error = /usr/local/mysql57_data/mysql3306/log/mysql-error.log
启动&错误日志信息

slow_query_log = on
慢查询日志开关

long_query_time = n

界定慢查询阈值，单位秒

log_output = file|table

慢查询输出位置，文件或者表，如果是文件的话，目标为slow_query_log_file ，如果是表的话，存储在mysql.slowlog

slow_query_log_file = /usr/local/mysql57_data/mysql3306/log/slow_query_log .log
慢查询日志文件

log_queries_not_using_indexes

捕获没有用到索引的查询，同样会记录到慢查询的目标中

log_bin_trust_function_creators = on

存储过程或者函数需要标记是否修改数据，参考

######################################################################################

binlog相关参数

binlog_format = row|statment|mixed

　　row level

　　日志中会记录每一行数据被修改的情况，然后在slave端对相同的数据进行修改。

　　优点：能清楚的记录每一行数据修改的细节

　　缺点：数据量太大

　　statement level（默认）

　　每一条被修改数据的sql都会记录到master的bin-log中，slave在复制的时候sql进程会解析成和原来master端执行过的相同的sql再次执行

　　优点：解决了 row level下的缺点，不需要记录每一行的数据变化，减少bin-log日志量，节约磁盘io，提高新能

　　缺点：容易出现主从复制不一致

　　mixed（混合模式）

　　结合了row level和statement level的优点，不建议使用

bin_log_cache_size
对于事务性的操作，是要事物完成的时候写入二进制日志，事物提交之前，执行的写入性操作会被缓存起来，直到整个事物完成，mysqld进程会将整个事物写入二进制日志。
当事物开始的时候，会按照binlog_cache_size系统变量指定的值分配内容空间，如果指定的binlog_cache_size缓存空间不够，执行的事务性操作回滚并提示失败
默认是32kb

max_bin_log_cache_size

max_binlog_cache_size语binlog_cache_size的区别在于前者是实例级别的cache，后者是session级别的cache，如果并发量很大，就需要考虑将max_binlog_cache_size设置的稍微大一些。
max_binlog_cache_size默认是是4gb，最大值也是4gb

log_bin

路径和binlog的前缀名称

expire_logs_days

binlog 过期清理时间阈值，单位为天

sync_binlog = 0|1|n

二进制日志记录可以使同步的，也即事物提交之后就写入二进制日志，也可以是异步的，由操作系统的磁盘缓存觉得什么时候写入磁盘。
由参数sync_binlog= n来控制，设置sync_binlog = 1的话，表示最高安全级别的写入（但也不能保证不丢失任何事物日志），相当于是一种安全写入模式，不过对性能有一定的影响。

gtid相关参数

　　gtid_mode = on|off

　　gtid模式的开关

　　enforce_gtid_consistency = 1

　　保证gtid安全的参数，不能在事物中创建临时表

　　binlog_gtid_simple_recovery = 1

　　参考：

1. 这个变量用于在mysql重启或启动的时候寻找gtids过程中，控制binlog 如何遍历的算法？

2. 当binlog_gtid_simple_recovery=false 时：

为了初始化 gtid_executed，算法是：从newest_binlog -> oldest_binlog 方向遍历读取，如果发现有previous_gtids_log_event ，那么就停止遍历

为了初始化 gtid_purged，算法是：从oldest_binlog -> newest_binlog 方向遍历读取, 如果发现有previous_gtids_log_event（not empty）或者至少有一个gtid_log_event的文件，那么就停止遍历

3. 当binlog_gtid_simple_recovery=true 时：

为了初始化 gtid_executed ，算法是：只需要读取newest_binlog

为了初始化 gtid_purged，算法是：只需要读取oldest_binlog

4. 当设置binlog_gtid_simple_recovery=true ，如果mysql版本低于5.7.7 ，可能会有gitd计算出错的可能，具体参考官方文档详细描述

在线gtid升级的时候，binlog_gtid_simple_recovery = true 必须打开，否则在binlog 删除的时候，会发生阻塞状况
在线gtid升级的时候，尽量将非gtid的binlog备份好，然后删除掉，以免出现莫名其妙的错误

binlog_ignore相关参数

　　binlog-ignore-db = db1|db2

　　binlog会忽略配置的数据库

　　replicate_wild_do_table = table_m|table_n

　　replicate-wild-ignore-table = table_x|table_y

　　对于binlog-ignore-db种，强制记录表级别的binlog

######################################################################################

innodb相关参数

innodb_flush_log_at_trx_commit = 0|1|2

mysql最经典的参数之一

如果innodb_flush_log_at_trx_commit设置为0，log buffer将每秒一次地写入log file中，并且log file的flush(刷到磁盘)操作同时进行.该模式下，在事务提交的时候，不会主动触发写入磁盘的操作。
如果innodb_flush_log_at_trx_commit设置为1，每次事务提交时mysql都会把log buffer的数据写入log file，并且flush(刷到磁盘)中去.
如果innodb_flush_log_at_trx_commit设置为2，每次事务提交时mysql都会把log buffer的数据写入log file.但是flush(刷到磁盘)操作并不会同时进行。该模式下,mysql会每秒执行一次 flush(刷到磁盘)操作。

innodb_doublewrite = 0|1

物理级保护数据安全，在将内存中的脏页写入磁盘之前，先将内存中的脏页复制到内存的doublewrite buffer中（2mb），然后将doublewrite buffer的数据写入共享表空间的页中（128个page，2mb大小），然后再写磁盘。

innodb_flush_method = fdatasync|o_dsync|o_direct
控制着innodb数据文件及redo log的打开、刷写模式，参考：

innodb_file_per_table = 1

共享表空间或者独立表空间，1表示每个表对应一个（组）物理文件。默认值。

innodb_buffer相关参数　　　

innodb_buffer_pool_size

buffer pool 物理内存的70%~80%

innodb_buffer_pool_instances

参考：

innodb_additional_mem_pool_size

该参数用来存储数据字典和其他内部数据结构。表越多，需要在这里分配的内存越多，

如果innodb用光了和这个池的内存，innodb开始从操作系统分配内存，并且往mysql错误日志中写警告信息，默认值是8mb，当发现

错误日志中有相关的警告信息时，就应该适当地增加该参数的大小，一般设置为16mb即可。

innodb_data相关参数

参考：

innodb_data_home_dir

这是innodb表的目录共用设置。如果没有在 my.cnf 进行设置，innodb 将使用mysql的 datadir 目录为缺省目录

innodb_data_file_path

单独指定数据文件的路径与大小。数据文件的完整路径由 innodb_data_home_dir 与这里所设定值的组合。

innodb_log相关参数:

参考：

innodb_log_group_home_dir

　　　　innodb 日志文件的路径。必须与 innodb_log_arch_dir 设置相同值。如果没有明确指定将默认在 mysql 的 datadir 目录下建立两个 5 mb 大小的 ib_logfile... 文件。

innodb_log_files_in_group

日志组中的日志文件数目。innodb 以环型方式(circular fashion)写入文件。数值 3 被推荐使用。在 my.cnf 中以数字格式设置。

innodb_log_file_size

日志组中的每个日志文件的大小(单位 mb)。如果 n 是日志组中日志文件的数目，那么理想的数值为 1m 至下面设置的缓冲池(buffer pool)大小的 1/n。较大的

值，可以减少刷新缓冲池的次数，从而减少磁盘 i/o。但是大的日志文件意味着在崩溃时需要更长的时间来恢复数据。日志文件总和必须小于 2 gb，3.23.55 和

4.0.9 以上为小于 4 gb。在 my.cnf 中以数字格式设置。

innodb_log_buffer_size

innodb 将日志写入日志磁盘文件前的缓冲大小。理想值为 1m 至 8m。大的日志缓冲允许事务运行时不需要将日志保存入磁盘而只到事务被提交(commit)。因

此，如果有大的事务处理，设置大的日志缓冲可以减少磁盘i/o。在 my.cnf 中以数字格式设置。

innodb_thread相关参数：

参考：

innodb_thread_concurrency

　　　　 innodb最大线程数

　　　　innodb_thread_sleep_delay

　　　　调整当并发 thread 到达 innodb_thread_concurrency时需要sleep的时间

　　　　innodb_concurrency_tickets

　　　　innodb_commit_concurrency

backend thread相关参数:

参考：

　 innodb_max_dirty_pages_pct

innodb_purge_threads

innodb_flush_neighbors

innodb_fast_shutdown

innodb_file：

参考：

innodb_file_format = antelope|barracuda

innodb_file_format_check

innodb_file_format_max

innodb io相关参数

参考：，

innodb_read_io_threads

在linux平台上就可以根据cpu核数来更改相应的参数值了，默认是4。

innodb_write_io_threads

同innodb_read_io_threads

　 innodb_io_capacity
　按照该值的百分比来控制刷新到磁盘页的数量
　 1. 在合并插入缓冲时, 合并插入缓冲的数量是该值的5%
　 2. 在从缓冲中刷新脏页时, 刷新的脏页数量等于该值.
　若用户使用了ssd类的磁盘或做了磁盘阵列, 可将该值适当调大.

innodb other parameter

innodb_lock_wait_timeout

innodb_lock_wait_timeout指的是事务等待获取资源等待的最长时间，超过这个时间还未分配到资源则会返回应用失败；参数的时间单位是秒，最小可设置为1s

innodb_print_all_deadlocks = 0|1

是否打开记录死锁日志到error log中，如果要分析死锁，设置为1，即打开

innodb_strict_mode

mysql5.7 默认打开，严格语法检查，有错误直接抛出，而不是给出警告。

######################################################################################

cache 相关参数

　　read_buffer_size

　　该参数用于表的顺序扫描，表示每个线程分配的缓冲区大小。比如，在进行全表扫描时，mysql会按照数据的存储顺序依次读取数据块，

　每次读取的数据块首先会暂存在read_buffer_size中，当buffer的空间被写满或者全部数据读取结束后，再讲buffer的数据返回给上层调用者，以提高效率。

　　默认为128kb，这个参数不要设置过大，一般在128~256即可。

　　sort_buffer_size

　在表进行order by和group by排序操作时，由于排序字段没有索引，会出现using filesort，为了提高性能，可用此参数增加每个线程分配

　的缓冲区大小。默认为2mb。这个参数不要设置的过大，一般在128~256kb即可。另外，一般出现using filesort的时候，要通过增加索引来解决。

　　join_buffer_size

　表进行连接操作时，如果关联的字段没有索引，会出现using join buffer，为了提高性能，可用此参数增加每个线程分配的缓冲区大小。

　　默认是128kb，这个参数不要设置的过大，一般在128~256kb即可，一般出现using join buffer的时候，要通过增加索引来解决。

　　read_rnd_buffer_size

　　该参数用于表的随机读取，表示每个线程分配的缓冲区大小。

　　两个表join的时候，加入连接字段为非聚集索引，并不是每次通过辅助索引读取到数据就回表去取记录，而是将其rowid给缓存起来，

　　然后对 rowid进行排序后，再去访问记录，这样就能将随机i/o转化为顺序i/o，从而大幅地提升性能。

　　tmp_table_size：

　　参考：

　global级别内部内存临时表的最大值，如果必须使用临时表且同时执行大量sql 生成大量临时表时适当增加 tmp_table_size

　如果生成的临时表数据量大于 tmp_table_size 则会将临时表存储与磁盘而不是内存,默认是128mb

　可以通过 created_tmp_disk_tables 和 created_tmp_tables 状态来分析是否需要增加tmp_table_size

　　max_heap_table_size

同tmp_table_size，它规定了内部内存临时表的最大值，每个线程都要分配。（实际起限制作用的是tmp_table_size和max_heap_table_size的最小值。）

　　thread_cache_size:

　　参考：

　线程池缓存大小 ( 当客户端断开连接后将当前线程缓存起来当在接到新的连接请求时快速响应无需创建新的线程 )

　connect相关参数

　　参考：

max_connections

最大连接数

wait_timeout

服务器关闭非交互连接之前等待活动的秒数。

interactive_timeout

服务器关闭交互式连接前等待活动的秒数。交互式客户端定义为在mysql_real_connect()中使用client_interactive选项的客户端。

　　max_connect_errors = n

防止暴力破解超过n次后禁止连接成功连接一次后会清零

　table_definition_cache：

　　参考：

　　table_definition_cache，该参数值的代表mysql可以缓存的表定义的数量。和前面的table cache不同的是，表定义的缓存占用空间很小，

而且不需要使用文件描述符，也就是只要打开.frm文件，缓存表定义，然后就可以关闭.frm文件。

　　table_open_cache：

　参考：，

　　table_open_cache指定表高速缓存的大小。每当mysql访问一个表时，如果在表缓冲区中还有空间，该表就被打开并放入其中，这样可以更快地访问表内容。

　　通过检查峰值时间的状态值open_tables和　　opened_tables，可以决定是否需要增加table_open_cache的值。

　　如果你发现open_tables等于table_open_cache，并且opened_tables在不断增长，那么你就需要增加table_open_cache的值了(上述状态值可：show status like ‘open%tables’获得)。

　query_cache

　查询缓存，不建议使用

　　query-cache-type:

　　　　是否打开查询缓存

　　query-cache-size:

　　　　查询缓存的大小

　　open_files_limit：

　　参考：

　　　　open_files_limit = table_open_cache*2 + innodb表

######################################################################################

master-slave主从复制相关参数

半同步master端参数：

参考：

rpl_semi_sync_master_enabled

on 开启半同步复制

rpl_semi_sync_master_timeout

参数控制，单位是毫秒，默认为10000，即10s，master等待slave超时时间，超时之后关闭半同步，转为异步复制

rpl_semi_sync_master_wait_no_slave
on默认值，当状态变量rpl_semi_sync_master_clients中的值小于rpl_semi_sync_master_wait_for_slave_count时，rpl_semi_sync_master_status依旧显示为on。
off当状态变量rpl_semi_sync_master_clients中的值于rpl_semi_sync_master_wait_for_slave_count时，rpl_semi_sync_master_status立即显示为off，即异步复制。
说得直白一点，如果我的架构是1主2从，2个从都采用了半同步复制，且设置的是rpl_semi_sync_master_wait_for_slave_count=2，如果其中一个挂掉了，
对于rpl_semi_sync_master_wait_no_slave设置为on的情况，此时显示的仍然是半同步复制，如果rpl_semi_sync_master_wait_no_slave设置为off，则会立刻变成异步复制。

rpl_semi_sync_master_wait_point=wait_after_commit|wait_after_sync
参考:https://mp.weixin.qq.com/s/fvven6nsyzqs9nca1ecoiq
wait_after_commit：半同步；wait_after_sync：增强（无损）半同步
为什么要增强的半同步复制？因为传统的半同步复制有潜在问题
wait_after_commit模式：主上客户端发出提交指令，事务提交到了存储引擎后，等待从传递过来ack，再向前端返回成功的状态。
与无损复制的区别就是：如果在主上这个事务已经提交到了存储引擎，而正在等待从的ack过程中---这个时候发生creash，则主上这个事务其实已经认为commit了，而从还没commit，
在切换到从后，就会回滚最后的这个事务，这个时候主从的时候其实就不一致了
after_commit在主机事务提交后将日志传送到从机，after_sync是先传再提交

rpl_stop_slave_timeout ???
控制stop slave 命令的执行时间
控制stop slave 的执行时间，在重放一个大的事务的时候,突然执行stop slave,命令 stop slave会执行很久,这个时候可能产生死锁或阻塞,严重影响性能，mysql
5.6可以通过rpl_stop_slave_timeout参数控制stop slave 的执行时间

######################################################################################

mysql主从复制slave端参数

　　timeout参数

slave_net_timeout

connect_retry/master_connection_retry

master_retry_count

　　这几个参数用一句话来解释：

备库过了slave_net_timeout秒之后，还没有收到主库来的数据，它就会开始第一次重试。

然后每过 connect_retry/master_connection_retry秒后，备库会再次尝试重连主库。直到重试了 master_retry_count 次，它才会放弃重试。

　　performance and replication carsh safety相关参数：

　　参考：

　　 master_info_repository = file|table
master_info持久化方式

sync_master_info = n

每n个事件写入一次表/文件

relay_log_info_repository = file|table

relay_info持久化方式

sync_relay_log_info = n

　　每n个事件写入一次表/文件

　　relay log信息如果配置为非table模式，写事物和写文件（将已经应用的日志位置写入文件）是无法保持一致的

　　mysql 5.6版本通过将复制信息存放到表中来解决此问题.通过配置两个参数 relay_log_info_repository=table，master_info_repository=table，

　　relay log info 会存放到 mysql.slave_relay_log_info表中，

　　master info 会存放mysql.slave_master_info表中。就是把sql线程执行事务和更新mysql.slave_replay_log_info的语句看成一个事务处理,这样就会一直同步的.

半同步复制slave端相关参数

　　rpl-semi-sync-slave-enabled = on

slave开启半同步

rpl_semi_sync_master_trace_level

用于开启半同步复制模式时的调试级别，默认是32

rpl_semi_sync_slave_trace_level

用于开启半同步复制模式时的调试级别，默认是32

parallel replication多线程复制

slave_parallel_workers = n

slave上多个线程回放master上的binlog

slave_parallel_type = database | logical_clock

database：默认值，基于库的并行复制方式

logical_clock：基于组提交的并行复制方式

　　slave_preserve_commit_order =0| 1

当slave_preserve_commit_order=0时

没有办法保证顺序，在恢复的过程中会有问题,到时候你怎么start slave 呢？

start slave until sql_after_mts_gaps ; reset slave

master执行顺序: last_committed=0,sequence_number=1,2,3,4

slave执行顺序：有可能就是 last_committed=0,sequence_number=1,4,3,2

当slave_preserve_commit_order=1时

后一个sequence_number提交的时候，会等待前一个sequence_number完成。

waiting for preceding transaction to commit

　　slave relay log

max_relay_log_size
标记relay log 允许的最大值，如果该值为0，则默认值为max_binlog_size(1g)；如果不为0，则max_relay_log_size则为最大的relay_log文件大小；

relay_log
定义relay_log的位置和名称，如果值为空，则默认位置在数据文件的目录，文件名为host_name-relay-bin.nnnnnn（by default, relay log file names have the form host_name-relay-bin.nnnnnn in the data directory）；

relay_log_index
同relay_log，定义relay_log的位置和名称；

relay_log_info_repository = table|file
relay_log_info_file

设置relay-log.info的位置和名称（relay-log.info记录master的binary_log的恢复位置和relay_log的位置），也可以配置记录到mysql库中的slave_relay_log_info表中；
relay-log-recovery = 1
这个参数的作用是：当slave从库宕机后，假如relay-log损坏了，导致一部分中继日志没有处理，则自动放弃所有未执行的relay-log，并且重新从
master上获取日志，这样就保证了relay-log的完整性。默认情况下该功能是关闭的，将relay_log_recovery的值设置为 1时，可在slave从库上开启该功能，建议开启。
relay-log-purge
是否自动清空不再需要中继日志时。默认值为1(启用)

　　slave冲突解决模式

　　slave_exec_mode = strict|idempotent|smart

上一篇：雪花算法（06）再说几个位运算

下一篇：表单个性化存在后台数据表

MySQL相关参数总结

django连接mysql配置方法总结(推荐)

优化RequireJS项目的相关技巧总结

Retrofit2.0 实现图文（参数+图片）上传方法总结

mysql 开发进阶篇系列 47 xtrabackup (完全备份恢复，恢复后重启失败总结)

JavaScript类型相关的常用操作总结

2019上半年总结——Github上那些Java面试、学习相关仓库

Mysql的子查询相关知识，少但是精

用Mysql进行emp、dept、salgrade表的相关查询操作

Kafka相关内容总结（存储和性能）

Javascript中字符串相关常用的使用方法总结