浅析MySQL内存的使用说明(全局缓存+线程缓存)
首先我们来看一个公式,mysql中内存分为全局内存和线程内存两大部分(其实并不全部,只是影响比较大的 部分):
per_thread_buffers=(read_buffer_size+read_rnd_buffer_size+sort_buffer_size+thread_stack+join_buffer_size+binlog_cache_size
+tmp_table_size)*max_connections
global_buffers=
innodb_buffer_pool_size+innodb_additional_mem_pool_size+innodb_log_buffer_size+key_buffer_size+query_cache_size
total_memory=global_buffers+per_thread_buffers
全局缓存:
key_buffer_size:决定索引处理的速度,尤其是索引读的速度。默认值是16m,通过检查状态值key_read_requests和key_reads,可以知道key_buffer_size设置是否合理。比例key_reads / key_read_requests应该尽可能的低,至少是1:100,1:1000更好(上述状态值可以使用'key_read%'获得用来显示状态数据)。key_buffer_size只对myisam表起作用。即使你不使用myisam表,但是内部的临时磁盘表是myisam表,也要使用该值。可以使用检查状态值'created_tmp_disk_tables'得知详情。
innodb_buffer_pool_size:innodb使用该参数指定大小的内存来缓冲数据和索引,这个是innodb引擎中影响性能最大的参数。
innodb_additional_mem_pool_size:指定innodb用来存储数据字典和其他内部数据结构的内存池大小。缺省值是8m。通常不用太大,只要够用就行,应该与表结构的复杂度有关系。如果不够用,mysql会在错误日志中写入一条警告信息。
innodb_log_buffer_size:指定innodb用来存储日志数据的缓存大小,如果您的表操作中包含大量并发事务(或大规模事务),并且在事务提交前要求记录日志文件,请尽量调高此项值,以提高日志效率。
query_cache_size:是mysql的查询缓冲大小。(从4.0.1开始,mysql提供了查询缓冲机制)使用查询缓冲,mysql将select语句和查询结果存放在缓冲区中,今后对于同样的select语句(区分大小写),将直接从缓冲区中读取结果。根据mysql用户手册,使用查询缓冲最多可以达到238%的效率。通过检查状态值'qcache_%',可以知道query_cache_size设置是否合理:如果qcache_lowmem_prunes的值非常大,则表明经常出现缓冲不够的情况,如果qcache_hits的值也非常大,则表明查询缓冲使用非常频繁,此时需要增加缓冲大小;如果qcache_hits的值不大,则表明你的查询重复率很低,这种情况下使用查询缓冲反而会影响效率,那么可以考虑不用查询缓冲。此外,在select语句中加入sql_no_cache可以明确表示不使用查询缓冲。
线程缓存
每个连接到mysql服务器的线程都需要有自己的缓冲。大概需要立刻分配256k,甚至在线程空闲时,它们使用默认的线程堆栈,网络缓存等。事务开始之后,则需要增加更多的空间。运行较小的查询可能仅给指定的线程增加少量的内存消耗,然而如果对数据表做复杂的操作例如扫描、排序或者需要临时表,则需分配大约read_buffer_size,sort_buffer_size,read_rnd_buffer_size,tmp_table_size大小的内存空间。不过它们只是在需要的时候才分配,并且在那些操作做完之后就释放了。有的是立刻分配成单独的组块。tmp_table_size 可能高达mysql所能分配给这个操作的最大内存空间了。
read_buffer_size:是mysql读入缓冲区大小。对表进行顺序扫描的请求将分配一个读入缓冲区,mysql会为它分配一段内存缓冲区。read_buffer_size变量控制这一缓冲区的大小。如果对表的顺序扫描请求非常频繁,并且你认为频繁扫描进行得太慢,可以通过增加该变量值以及内存缓冲区大小提高其性能。
sort_buffer_size:是mysql执行排序使用的缓冲大小。如果想要增加order by的速度,首先看是否可以让mysql使用索引而不是额外的排序阶段。如果不能,可以尝试增加sort_buffer_size变量的大小。
read_rnd_buffer_size:是mysql的随机读缓冲区大小。当按任意顺序读取行时(例如,按照排序顺序),将分配一个随机读缓存区。进行排序查询时,mysql会首先扫描一遍该缓冲,以避免磁盘搜索,提高查询速度,如果需要排序大量数据,可适当调高该值。但mysql会为每个客户连接发放该缓冲空间,所以应尽量适当设置该值,以避免内存开销过大。
tmp_table_size:是mysql的临时表缓冲大小。所有联合在一个dml指令内完成,并且大多数联合甚至可以不用临时表即可以完成。大多数临时表是基于内存的(heap)表。具有大的记录长度的临时表 (所有列的长度的和)或包含blob列的表存储在硬盘上。如果某个内部heap(堆积)表大小超过tmp_table_size,mysql可以根据需要自动将内存中的heap表改为基于硬盘的myisam表。还可以通过设置tmp_table_size选项来增加临时表的大小。也就是说,如果调高该值,mysql同时将增加heap表的大小,可达到提高联接查询速度的效果。
thread_stack :主要用来存放每一个线程自身的标识信息,如线程id,线程运行时基本信息等等,我们可以通过 thread_stack 参数来设置为每一个线程栈分配多大的内存。
join_buffer_size:应用程序经常会出现一些两表(或多表)join的操作需求,mysql在完成某些 join 需求的时候(all/index join),为了减少参与join的“被驱动表”的读取次数以提高性能,需要使用到 join buffer 来协助完成 join操作。当 join buffer 太小,mysql 不会将该 buffer 存入磁盘文件,而是先将join buffer中的结果集与需要 join 的表进行 join 操作,然后清空 join buffer 中的数据,继续将剩余的结果集写入此 buffer 中,如此往复。这势必会造成被驱动表需要被多次读取,成倍增加 io 访问,降低效率。
binlog_cache_size:在事务过程中容纳二进制日志sql 语句的缓存大小。二进制日志缓存是服务器支持事务存储引擎并且服务器启用了二进制日志(—log-bin 选项)的前提下为每个客户端分配的内存,注意,是每个client 都可以分配设置大小的binlog cache 空间。如果系统中经常会出现多语句事务的话,可以尝试增加该值的大小,以获得更好的性能。当然,我们可以通过mysql 的以下两个状态变量来判断当前的binlog_cache_size 的状况:binlog_cache_use 和binlog_cache_disk_use。“max_binlog_cache_size”:和"binlog_cache_size"相对应,但是所代表的是binlog 能够使用的最大cache 内存大小。当我们执行多语句事务的时候,max_binlog_cache_size 如果不够大的话,系统可能会报出“ multi-statement transaction required more than 'max_binlog_cache_size' bytes ofstorage”的错误。
其中需要注意的是:table_cache表示的是所有线程打开的表的数目,和内存无关。