欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  数据库

在linux下,解决mysql长连接异常错误(SIGPIPE)

程序员文章站 2022-06-11 11:57:40
...

1. 最近在linux下开发IM服务端,遇到一个导致服务端崩溃的问题: 问题描述:服务端运行一个晚上,到了第二天早上一来,登陆客户端时,系统崩溃, 从log与gdb的信息得知,崩溃在执行 mysql_ping()的时候: (gdb) bt #0 0x00110416 in __kernel_vsyscall ()

1. 最近在linux下开发IM服务端,遇到一个导致服务端崩溃的问题:

问题描述:服务端运行一个晚上,到了第二天早上一来,登陆客户端时,系统崩溃,

从log与gdb的信息得知,崩溃在执行 mysql_ping()的时候:

(gdb) bt
#0 0x00110416 in __kernel_vsyscall ()
#1 0x0092f918 in send () from /lib/libpthread.so.0
#2 0x00190e85 in vio_write () from /usr/local/mysql/lib/libmysqlclient.so.18
#3 0x00179a96 in net_write_packet () from /usr/local/mysql/lib/libmysqlclient.so.18
#4 0x00179d98 in net_flush () from /usr/local/mysql/lib/libmysqlclient.so.18
#5 0x00179f20 in net_write_command () from /usr/local/mysql/lib/libmysqlclient.so.18
#6 0x00175a18 in cli_advanced_command () from /usr/local/mysql/lib/libmysqlclient.so.18
#7 0x0016ae7d in mysql_ping () from /usr/local/mysql/lib/libmysqlclient.so.18


通过在网上查资料得知,问题可能如下:
应用程序和数据库建立连接,如果超过 wait_timeout (默认28000秒8小时) 应用程序不去访问数据库,连接一直处于空闲状态,那么MySQL就会自动关闭该连接 ,如果再在该连接上执行查询操作,就会发生MySQL server has gone away错误。
show variables like "%timeout%";
一种方式是将此数值设大;
另外一个好的解决方法是使用mysql_ping。在使用mysql_real_connect连接数据库之后,再使用mysql_options( &mysql, MYSQL_OPT_RECONNECT, … ) 来设置为自动重连。这样当mysql连接丢失的时候,使用mysql_ping能够自动重连数据库。如果是在mysql 5.1.6之前,那么则应在每次执行完real_connect 之后执行mysql_options( &mysql, MYSQL_OPT_RECONNECT, … ) ,如果是mysql 5.1.6+,则在connect之前执行一次就够了。
有一种很自然的想法就是,新开一个线程,让它隔一定时间(如20秒)就执行一次mysql_ping.除此而外它什么都不用做。但是显然,这个线程必须与其它线程共享一个mysql连接,共享该mysql句柄。否则这样做一点意义都没有。


所以在代码中修改如下:
1. 在数据库初始化的函数中,在执行mysql_real_connect之前,使用mysql_options( &mysql, MYSQL_OPT_RECONNECT, … )
2. 增加一个新线程,定时地执行mysql_ping

问题解决