MySQL 大数据量快速插入方法和语句优化分享
程序员文章站
2024-02-13 07:59:40
锁定也将降低多连接测试的整体时间,尽管因为它们等候锁定最大等待时间将上升。例如: 复制代码 代码如下: connection 1 does 1000 inserts con...
锁定也将降低多连接测试的整体时间,尽管因为它们等候锁定最大等待时间将上升。例如:
connection 1 does 1000 inserts
connections 2, 3, and 4 do 1 insert
connection 5 does 1000 inserts
如果不使用锁定,2、3和4将在1和5前完成。如果使用锁定,2、3和4将可能不在1或5前完成,但是整体时间应该快大约40%。
insert、update和delete操作在mysql中是很快的,通过为在一行中多于大约5次连续不断地插入或更新的操作加锁,可以获得更好的整体性能。如果在一行中进行多次插入,可以执行lock tables,随后立即执行unlock tables(大约每1000行)以允许其它的线程访问表。这也会获得好的性能。
insert装载数据比load data infile要慢得多,即使是使用上述的策略。
为了对load data infile和insert在myisam表得到更快的速度,通过增加key_buffer_size系统变量来扩大 键高速缓冲区。
insert语法
insert [low_priority | delayed | high_priority] [ignore]
[into] tbl_name [(col_name,...)]
values ({expr | default},...),(...),...
[ on duplicate key update col_name=expr, ... ]
或:
insert [low_priority | delayed | high_priority] [ignore]
[into] tbl_name
set col_name={expr | default}, ...
[ on duplicate key update col_name=expr, ... ]
或:
insert [low_priority | high_priority] [ignore]
[into] tbl_name [(col_name,...)]
select ...
[ on duplicate key update col_name=expr, ... ]
一、delayed 的使用
使用延迟插入操作delayed调节符应用于insert和replace语句。当delayed插入操作到达的时候,服务器把数据行放入一个队列中,并立即给客户端返回一个状态信息,这样客户端就可以在数据表被真正地插入记录之前继续进行操作了。如果读取者从该数据表中读取数据,队列中的数据就会被保持着,直到没有读取者为止。
接着服务器开始插入延迟数据行(delayed-row)队列中的数据行。在插入操作的同时,服务器还要检查是否有新的读取请求到达和等待。如果有,延迟数据行队列就被挂起,允许读取者继续操作。当没有读取者的时候,服务器再次开始插入延迟的数据行。这个过程一直进行,直到队列空了为止。
几点要注意事项:
insert delayed应该仅用于指定值清单的insert语句。服务器忽略用于insert delayed...select语句的delayed。服务器忽略用于insert delayed...on duplicate update语句的delayed。
因为在行被插入前,语句立刻返回,所以您不能使用last_insert_id()来获取auto_increment值。auto_increment值可能由语句生成。
对于select语句,delayed行不可见,直到这些行确实被插入了为止。
delayed在从属复制服务器中被忽略了,因为delayed不会在从属服务器中产生与主服务器不一样的数据。注意,目前在队列中的各行只保存在存储器中,直到它们被插入到表中为止。这意味着,如果您强行中止了mysqld(例如,使用kill -9)或者如果mysqld意外停止,则所有没有被写入磁盘的行都会丢失。
复制代码 代码如下:
connection 1 does 1000 inserts
connections 2, 3, and 4 do 1 insert
connection 5 does 1000 inserts
如果不使用锁定,2、3和4将在1和5前完成。如果使用锁定,2、3和4将可能不在1或5前完成,但是整体时间应该快大约40%。
insert、update和delete操作在mysql中是很快的,通过为在一行中多于大约5次连续不断地插入或更新的操作加锁,可以获得更好的整体性能。如果在一行中进行多次插入,可以执行lock tables,随后立即执行unlock tables(大约每1000行)以允许其它的线程访问表。这也会获得好的性能。
insert装载数据比load data infile要慢得多,即使是使用上述的策略。
为了对load data infile和insert在myisam表得到更快的速度,通过增加key_buffer_size系统变量来扩大 键高速缓冲区。
insert语法
复制代码 代码如下:
insert [low_priority | delayed | high_priority] [ignore]
[into] tbl_name [(col_name,...)]
values ({expr | default},...),(...),...
[ on duplicate key update col_name=expr, ... ]
或:
复制代码 代码如下:
insert [low_priority | delayed | high_priority] [ignore]
[into] tbl_name
set col_name={expr | default}, ...
[ on duplicate key update col_name=expr, ... ]
或:
复制代码 代码如下:
insert [low_priority | high_priority] [ignore]
[into] tbl_name [(col_name,...)]
select ...
[ on duplicate key update col_name=expr, ... ]
一、delayed 的使用
使用延迟插入操作delayed调节符应用于insert和replace语句。当delayed插入操作到达的时候,服务器把数据行放入一个队列中,并立即给客户端返回一个状态信息,这样客户端就可以在数据表被真正地插入记录之前继续进行操作了。如果读取者从该数据表中读取数据,队列中的数据就会被保持着,直到没有读取者为止。
接着服务器开始插入延迟数据行(delayed-row)队列中的数据行。在插入操作的同时,服务器还要检查是否有新的读取请求到达和等待。如果有,延迟数据行队列就被挂起,允许读取者继续操作。当没有读取者的时候,服务器再次开始插入延迟的数据行。这个过程一直进行,直到队列空了为止。
几点要注意事项:
insert delayed应该仅用于指定值清单的insert语句。服务器忽略用于insert delayed...select语句的delayed。服务器忽略用于insert delayed...on duplicate update语句的delayed。
因为在行被插入前,语句立刻返回,所以您不能使用last_insert_id()来获取auto_increment值。auto_increment值可能由语句生成。
对于select语句,delayed行不可见,直到这些行确实被插入了为止。
delayed在从属复制服务器中被忽略了,因为delayed不会在从属服务器中产生与主服务器不一样的数据。注意,目前在队列中的各行只保存在存储器中,直到它们被插入到表中为止。这意味着,如果您强行中止了mysqld(例如,使用kill -9)或者如果mysqld意外停止,则所有没有被写入磁盘的行都会丢失。