欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

非阻塞socket

程序员文章站 2022-04-24 15:48:26
#linux 非阻塞 connect函数开发测试环境:虚拟机CentOS,windows网络调试助手 非阻塞模式有3种用途 1.三次握手同时做其他的处理。connect要花一个往返时间完成,从几毫秒的局域网到几百毫秒或几秒的广域网。这段时间可能有一些其他的处理要执行,比如数据准备,预处理等。 2.用... ......
#linux 非阻塞 connect函数 开发测试环境:虚拟机centos,windows网络调试助手 非阻塞模式有3种用途 1.三次握手同时做其他的处理。connect要花一个往返时间完成,从几毫秒的局域网到几百毫秒或几秒的广域网。这段时间可能有一些其他的处理要执行,比如数据准备,预处理等。 2.用这种技术建立多个连接。这在web浏览器中很普遍. 3.由于程序用select等待连接完成,可以设置一个select等待时间限制,从而缩短connect超时时间。多数实现中,connect的超时时间在75秒到几分钟之间。有时程序希望在等待一定时间内结束,使用非阻塞connect可以防止阻塞75秒,在多线程网络编程中,尤其必要。 例如有一个通过建立线程与其他主机进行socket通信的应用程序,如果建立的线程使用阻塞connect与远程通信,当有几百个线程并发的时候,由于网络延迟而全部阻塞,阻塞的线程不会释放系统的资源,同一时刻阻塞线程超过一定数量时候,系统就不再允许建立新的线程(每个进程由于进程空间的原因能产生的线程有限),如果使用非阻塞的connect,连接失败使用select等待很短时间,如果还没有连接后,线程立刻结束释放资源,防止大量线程阻塞而使程序崩溃。 目前connect非阻塞编程的普遍思路是: 在一个tcp套接口设置为非阻塞后,调用connect,connect会在系统提供的errno变量中返回一个einrpocess错误,此时tcp的三路握手继续进行。之后可以用select函数检查这个连接是否建立成功。以下实验基于unix网络编程和网络上给出的普遍示例,在经过大量测试之后,发现其中有很多方法,在linux中,并不适用。 我先给出了重要源码的逐步分析,在最后给出完整的connect非阻塞源码。 1.首先填写套接字结构,包括远程的ip,通信端口如下: */ ```struct sockaddr_in serv_addr; serv_addr.sin_family=af_inet; serv_addr.sin_port=htons(9999); serv_addr.sin_addr.s_addr = inet_addr("58.31.231.255"); //inet_addr转换为网络字节序 bzero(&(serv_addr.sin_zero),8); ``` ##### 2.建立socket套接字: ```if ((sockfd = socket(af_inet, sock_stream, 0)) == -1) { perror("socket creat error"); return 1; } ``` ##### 3.将socket建立为非阻塞,此时socket被设置为非阻塞模式 ```flags = fcntl(sockfd,f_getfl,0);//获取建立的sockfd的当前状态(非阻塞) fcntl(sockfd,f_setfl,flags|o_nonblock);//将当前sockfd设置为非阻塞 ``` #####4. 建立connect连接,此时socket设置为非阻塞,connect调用后,无论连接是否建立立即返回-1,同时将errno(包含errno.h就可以直接使用)设置为einprogress, 表示此时tcp三次握手仍旧进行,如果errno不是einprogress,则说明连接错误,程序结束。当客户端和服务器端在同一台主机上的时候,connect回马上结束,并返回0;无需等待,所以使用goto函数跳过select等待函数,直接进入连接后的处理部分。 ``` if ( ( n = connect( sockfd, ( struct sockaddr *)&serv_addr , sizeof(struct sockaddr)) ) < 0 ) { if(errno != einprogress) return 1; } if(n==0) { printf("connect completed immediately"); goto done; } ``` #####5.设置等待时间,使用select函数等待正在后台连接的connect函数,这里需要说明的是使用select监听socket描述符是否可读或者可写,如果只可写,说明连接成功,可以进行下面的操作。如果描述符既可读又可写,分为两种情况,第一种情况是socket连接出现错误(不要问为什么,这是系统规定的,可读可写时候有可能是connect连接成功后远程主机断开了连接close(socket)),第二种情况是connect连接成功,socket读缓冲区得到了远程主机发送的数据。需要通过connect连接后返回给errno的值来进行判定,或者通过调用 getsockopt(sockfd,sol_socket,so_error,&error,&len); 函数返回值来判断是否发生错误,这里存在一个可移植性问题,在solaris中发生错误返回-1,但在其他系统中可能返回0.我首先按unix网络编程的源码进行实现。如下: ```fd_zero(&rset); fd_set(sockfd,&rset); wset = rset; tval.tv_sec = 0; tval.tv_usec = 300000; int error; socklen_t len; if(( n = select(sockfd+1, &rset, &wset, null,&tval)) <= 0) { printf("time out connect error"); close(sockfd); return -1; } if ( fd_isset(sockfd,&rset) || fd_isset(sockfd,&west) ) { len = sizeof(error); if( getsockopt(sockfd,sol_socket,so_error,&error,&len) <0) return 1; ``` /* 这里我测试了一下,按照unix网络编程的描述,当网络发生错误的时候,getsockopt返回-1,return -1,程序结束。网络正常时候返回0,程序继续执行。 可是我在linux下,无论网络是否发生错误,getsockopt始终返回0,不返回-1,说明linux与unix网络编程还是有些细微的差别。就是说当socket描述符可读可写的时候,这段代码不起作用。不能检测出网络是否出现故障。 我测试的方法是,当调用connect后,sleep(2)休眠2秒,借助这两秒时间将网络助手断开连接,这时候select返回2,说明套接口可读又可写,应该是网络连接的出错情况。 此时,getsockopt返回0,不起作用。获取errno的值,指示为einprogress,没有返回unix网络编程中说的enotconn,einprogress表示正在试图连接,不能表示网络已经连接失败。 针对这种情况,unix网络编程中提出了另外3种方法,这3种方法,也是网络上给出的常用的非阻塞connect示例: a.再调用connect一次。失败返回errno是eisconn说明连接成功,表示刚才的connect成功,否则返回失败。 代码如下:*/ ```int connect_ok; connect(sockfd, (struct sockaddr *)&serv_addr, sizeof(struct sockaddr) ); switch (errno) { case eisconn: //connect ok printf("connect ok \n"); connect_ok = 1; break; case ealready: connect_0k = -1 break; case einprogress: // is connecting, need to check again connect_ok = -1 break; default: printf("connect fail err=%d \n",errno); connect_ok = -1; break; } ``` /*如程序所示,根据再次调用的errno返回值将connect_ok的值,来进行下面的处理,connect_ok为1继续执行其他操作,否则程序结束。 但这种方法我在linux下测试了,当发生错误的时候,socket描述符(我的程序里是sockfd)变成可读且可写,但第二次调用connect 后,errno并没有返回eisconn,,也没有返回连接失败的错误,仍旧是einprogress,而当网络不发生故障的时候,第二次使用 connect连接也返回einprogress,因此也无法通过再次connect来判断连接是否成功。 b.unix网络编程中说使用read函数,如果失败,表示connect失败,返回的errno指明了失败原因,但这种方法在linux上行不通,linux在socket描述符为可读可写的时候,read返回0,并不会置errno为错误。 c.unix网络编程中说使用getpeername函数,如果连接失败,调用该函数后,通过errno来判断第一次连接是否成功,但我试过了,无论网络连接是否成功,errno都没变化,都为einprogress,无法判断。 悲哀啊,即使调用getpeername函数,getsockopt函数仍旧不行。 综上方法,既然都不能确切知道非阻塞connect是否成功,所以我直接当描述符可读可写的情况下进行发送,通过能否获取服务器的返回值来判断是否成功。(如果服务器端的设计不发送数据,那就悲哀了。) 程序的书写形式出于可移植性考虑,按照unix网络编程推荐写法,使用getsocketopt进行判断,但不通过返回值来判断,而通过函数的返回参数来判断。 #####6. 用select查看接收描述符,如果可读,就读出数据,程序结束。在接收数据的时候注意要先对先前的rset重新赋值为描述符,因为select会对 rset清零,当调用select后,如果socket没有变为可读,则rset在select会被置零。所以如果在程序中使用了rset,最好在使用时候重新对rset赋值。 程序如下:*/ ``` fd_zero(&rset); fd_set(sockfd,&rset);//如果前面select使用了rset,最好重新赋值 if( ( n = select(sockfd+1,&rset,null, null,&tval)) <= 0 ) { close(sockfd); return -1; } if ((recvbytes=recv(sockfd, buf, 1024, 0)) ==-1) { perror("recv error!"); close(sockfd); return 1; } printf("receive num %d\n",recvbytes); printf("%s\n",buf); ``` 非阻塞connect完整代码综合如下: ```intmain(int argc, char** argv) { intsockfd,recvbytes,res,flags,error,n; socklen_tlen; fd_setrset,wset; structtimevaltval; tval.tv_sec=0; tval.tv_usec=300000; structsockaddr_inserv_addr; char*senddata="1234567890";//发送字符串 charbuf[1024]="/0"; //接收buffer //创建socket描述符 if((sockfd = socket(af_inet, sock_stream, 0)) == -1) { perror("socket create failed"); return1; } serv_addr.sin_family=af_inet; serv_addr.sin_port=htons(9999); serv_addr.sin_addr.s_addr=inet_addr("58.31.231.255"); bzero(&(serv_addr.sin_zero),8); flags=fcntl(sockfd,f_getfl,0); fcntl(sockfd,f_setfl,flags|o_nonblock);//设置为非阻塞 if( (res = connect(sockfd, (struct sockaddr *)&serv_addr, sizeof(struct sockaddr)) )< 0) { if(errno != einprogress) { return1; } } //如果server与client在同一主机上,有些环境socket设为非阻塞会返回 0 if(0 == res) goto done; fd_zero(&rset); fd_set(sockfd,&rset); wset=rset; if( ( res = select(sockfd+1, null, &wset, null,&tval) ) <= 0) { perror("connect time out/n"); close(sockfd); return1; } else { len=sizeof(error); getsockopt(sockfd, sol_socket, so_error, &error, &len); if(error) { fprintf(stderr, "error in connection() %d - %s/n", error, strerror(error)); return1; } } done: if( (n = send(sockfd, senddata, strlen(senddata),0) ) ==-1 ) { perror("send error!"); close(sockfd); return1; } if( ( n = select(sockfd+1,&rset,null, null,&tval)) <= 0 )//rset没有使用过,不用重新置为sockfd { perror("receive time out or connect error"); close(sockfd); return-1; } if((recvbytes=recv(sockfd, buf, 1024, 0)) ==-1) { perror("recv error!"); close(sockfd); return1; } printf("receive num %d/n",recvbytes); printf("%s/n",buf); } ```