MySQL 大数据量快速插入方法和语句优化分享

程序员文章站 2024-02-12 14:18:28

锁定也将降低多连接测试的整体时间，尽管因为它们等候锁定最大等待时间将上升。例如：复制代码代码如下: connection 1 does 1000 inserts con...

锁定也将降低多连接测试的整体时间，尽管因为它们等候锁定最大等待时间将上升。例如：

 
connection 1 does 1000 inserts 
connections 2, 3, and 4 do 1 insert 
connection 5 does 1000 inserts 

　　如果不使用锁定，2、3和4将在1和5前完成。如果使用锁定，2、3和4将可能不在1或5前完成，但是整体时间应该快大约40%。

　　insert、update和delete操作在mysql中是很快的，通过为在一行中多于大约5次连续不断地插入或更新的操作加锁，可以获得更好的整体性能。如果在一行中进行多次插入，可以执行lock tables，随后立即执行unlock tables(大约每1000行)以允许其它的线程访问表。这也会获得好的性能。

　　insert装载数据比load data infile要慢得多，即使是使用上述的策略。

　　为了对load data infile和insert在myisam表得到更快的速度，通过增加key_buffer_size系统变量来扩大键高速缓冲区。

　　insert语法

复制代码代码如下:

 
insert [low_priority | delayed | high_priority] [ignore] 
[into] tbl_name [(col_name,...)] 
values ({expr | default},...),(...),... 
[ on duplicate key update col_name=expr, ... ] 

　　或：

复制代码代码如下:

 

insert [low_priority | delayed | high_priority] [ignore] 
[into] tbl_name 
set col_name={expr | default}, ... 
[ on duplicate key update col_name=expr, ... ] 

　　或：

复制代码代码如下:

 
　 
insert [low_priority | high_priority] [ignore] 
[into] tbl_name [(col_name,...)] 
select ... 
[ on duplicate key update col_name=expr, ... ] 

　　一、delayed 的使用

　　使用延迟插入操作delayed调节符应用于insert和replace语句。当delayed插入操作到达的时候，服务器把数据行放入一个队列中，并立即给客户端返回一个状态信息，这样客户端就可以在数据表被真正地插入记录之前继续进行操作了。如果读取者从该数据表中读取数据，队列中的数据就会被保持着，直到没有读取者为止。

　　接着服务器开始插入延迟数据行（delayed-row）队列中的数据行。在插入操作的同时，服务器还要检查是否有新的读取请求到达和等待。如果有，延迟数据行队列就被挂起，允许读取者继续操作。当没有读取者的时候，服务器再次开始插入延迟的数据行。这个过程一直进行，直到队列空了为止。

　　几点要注意事项：

　　insert delayed应该仅用于指定值清单的insert语句。服务器忽略用于insert delayed...select语句的delayed。服务器忽略用于insert delayed...on duplicate update语句的delayed。

　　因为在行被插入前，语句立刻返回，所以您不能使用last_insert_id()来获取auto_increment值。auto_increment值可能由语句生成。

　　对于select语句，delayed行不可见，直到这些行确实被插入了为止。

　　delayed在从属复制服务器中被忽略了，因为delayed不会在从属服务器中产生与主服务器不一样的数据。注意，目前在队列中的各行只保存在存储器中，直到它们被插入到表中为止。这意味着，如果您强行中止了mysqld(例如，使用kill -9)或者如果mysqld意外停止，则所有没有被写入磁盘的行都会丢失。

上一篇：九、处理Cookie

下一篇： Python如何解决sqlite3.DatabaseError: database disk image is malformed

MySQL 大数据量快速插入方法和语句优化分享